常用正则表达式 -- 工作因为vb更精彩-- 编程爱好者博客

匹配中文字符的正则表达式： [\u4e00-\u9fa5]匹配双字节字符(包括汉字在内)：[^\x00-\xff]应用：计算字符串的长度（一个双字节字符长度计2，ASCII字符计1）String.prototype.len=function(){return this.replace([^\x00-\xff]/g,"aa").length;}匹配空行的正则表达式：\n[\s| ]*\r匹配HTML标记的正则表达式：/<(.*)>.*<\/\1>|<(.*) \/>/ 匹配首尾空格的正则表达式：(^\s*)|(\s*$)应用：javascript中没有像vbscript那样的trim函数，我们就可以利用这个表达式来实现，如下：String.prototype.trim = function(){return this.replace(/(^\s*)|(\s*$)/g, "");}利用正则表达式分解和转换IP地址：下面是利用正则表达式匹配IP地址，并将IP地址转换成对应数值的Javascript程序：function IP2V(ip){re=/(\d+)\.(\d+)\.(\d+)\.(\d+)/g //匹配IP地址的正则表达式if(re.test(ip)){return RegExp.$1*Math.pow(255,3))+RegExp.$2*Math.pow(255,2))+RegExp.$3*255+RegExp.$4*1}else{throw new Error("Not a valid IP address!")}}不过上面的程序如果不用正则表达式，而直接用split函数来分解可能更简单，程序如下：var ip="10.100.20.168"ip=ip.split(".")alert("IP值是："+(ip[0]*255*255*255+ip[1]*255*255+ip[2]*255+ip[3]*1))匹配Email地址的正则表达式：\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*匹配网址URL的正则表达式：http://([\w-]+\.)+[\w-]+(/[\w- ./?%&=]*)?利用正则表达式去除字串中重复的字符的算法程序：[注：此程序不正确，原因见本贴回复]var s="abacabefgeeii"var s1=s.replace(/(.).*\1/g,"$1")var re=new RegExp("["+s1+"]","g")var s2=s.replace(re,"") alert(s1+s2) //结果为：abcefgi我原来在CSDN上发贴寻求一个表达式来实现去除重复字符的方法，最终没有找到，这是我能想到的最简单的实现方法。思路是使用后向引用取出包括重复的字符，再以重复的字符建立第二个表达式，取到不重复的字符，两者串连。这个方法对于字符顺序有要求的字符串可能不适用。得用正则表达式从URL地址中提取文件名的javascript程序，如下结果为page1s="http://www.9499.net/page1.htm"s=s.replace(/(.*\/){0,}([^\.]+).*/ig,"$2")alert(s)利用正则表达式限制网页表单里的文本框输入内容：用正则表达式限制只能输入中文：onkeyup="value=value.replace(/[^\u4E00-\u9FA5]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\u4E00-\u9FA5]/g,''))"用正则表达式限制只能输入全角字符： onkeyup="value=value.replace(/[^\uFF00-\uFFFF]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\uFF00-\uFFFF]/g,''))"用正则表达式限制只能输入数字：onkeyup="value=value.replace(/[^\d]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))"用正则表达式限制只能输入数字和英文：onkeyup="value=value.replace(/[\W]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))" 出处：蓝色理想前一段时间写了2段EmEditor的宏，用来统计代码行数和简单的规约检查，稍微整理一下，下面是从EmEditor的Q&A的提取的实例：双引号包含的字符串strings surrounded by double-quotation marks“.*?” [ ]包含的字符串strings surrounded by [ ]\[[^\[]*?\] 变量名variable names[a-zA-Z_][a-zA-Z_0-9]* IP 地址IP addresses([0-9]{1,3})\.([0-9]{1,3})\.([0-9]{1,3})\.([0-9]{1,3}) 网页地址URL(\S+)://([^:/]+)(:(\d+))?(/[^#\s]*)(#(\S+))? 各行Tab以后的文字列lines followed by a tab\t.*$ 平仮名ひらがなHiragana[\x{3041}-\x{309e}] 全角片仮名全角カタカナFull-width Katakana[\x{309b}-\x{309c}\x{30a1}-\x{30fe}] 半角仮名半角カナHalf-width Kana[\x{ff61}-\x{ff9f}] 中日韩汉字CJK ideographs[\x{3400}-\x{9fff}\x{f900}-\x{fa2d}] 中日韩汉字符号CJK ideograph marks[\x{3000}-\x{3037}] 韩国字符Hangul[\x{1100}-\x{11f9}\x{3131}-\x{318e}\x{ac00}-\x{d7a3}] 行头插入 //Insert // at start of linesFind: ^Replace with: // 删除行头 //Remove // at end of linesFind: ^//Replace: 删除行后的空白文字（包含空格和制表位 Space+Tab）Remove trailing whitespacesFind: \s+?$Replace with: 将(abc)替换为[abc]Replace (abc) with [abc]Find: $(.*?)$Replace: \[\1\] 将<H3 …>替换为<H4 …>Replace <H3 …> with <H4 …>Find: <H3(.*?)>Replace: <H4\1> 将9/13/2003替换为2003年9月13日Replace 9/13/2003 with 2003.9.13Find: ([0-9]{1,2})/([0-9]{1,2})/([0-9]{2,4})Replace: \3年\1月\2日将字母a-z替换为大写字母Uppercase characters from a to zFind: [a-z]Replace: \U\0 首字母大写Capitalize all wordsFind: ([a-zA-Z])([a-zA-Z]*)Replace: \U\1\L\2

博客介绍

正文

常用正则表达式2008-04-20 17:04:00

评论