当前位置: 代码迷 >> Web前端 >> 正则表达式课题
  详细解决方案

正则表达式课题

热度:350   发布时间:2012-08-25 10:06:20.0
正则表达式专题

正则表达式匹配指定字符串之外的内容 ^(?!.*?排除的字符串).*$

工作中经常遇到分析log文件, 想从文件中找到和对应数据的内容,其他的内容不关心.

这样就想用一个正则表达式匹配指定字符串之外的内容,替换成空的, 剩下就是我们关心的log内容

^(?!.*?正则表达式).*$


问题情境

需要将RDL报表里的GetComment( Parameters!F0001.Value , Parameters!F0002.Value ,"total", Parameters!Language.Value)函数修改为GetCommentForComment ( Parameters!F0001.Value , Parameters!F0002.Value ,"total", Parameters!Language.Value, "ReportConnection0107" )。

思路

使用正则表达式里面的分组进行抓获,再用\1将中间固定的参数取出,组成新的字符串。

Vim实现

%s/GetComment(\(\(\s*\w\+!\w\+.\w\+\s*,\)\{2\}\s*"\w\+"\s*,\s*\w\+!\w\+.\w\+\s*\))/GetCommentForReport(\1, "ReportConnection0107")/gc?

解释:%为全局替换,s为替换。后面则是表达式,和正则表达式差不多,注意是*不需要转义,+ 和 .需要转义,最后的g代表当前行替换,c代表每次替换需要确认。

目标表达式中有\1,代表抓获的第一个字符串,多个字符串抓获则依次往下排列。\0表示原始字符串。

NotePad++/EditPlus实现

GetComment\(( *[a-zA-Z0-9]+![a-zA-Z0-9]+\.[a-zA-Z0-9]+ *, *[a-zA-Z0-9]+![a-zA-Z0-9]+\.[a-zA-Z0-9]+ *, *"[a-zA-Z0-9]+" *, *[a-zA-Z0-9]+![a-zA-Z0-9]+\.[a-zA-Z0-9]+ *)\)

替换为GetCommentForReport(\1, "ReportConnection0107")

解释:不知道为何,我无法使用\w\s匹配文字和空格,只能使用[a-zA-Z0-9]表示(完整的是[a-zA-Z0-9_])\w,用空格表示\s。

VisualStudio

由于RDL开发必然使用VisualStudio,所以用VS替换更方便。

GetComment\({ *[a-zA-Z0-9]+![a-zA-Z0-9]+\.[a-zA-Z0-9]+ *, *[a-zA-Z0-9]+![a-zA-Z0-9]+\.[a-zA-Z0-9]+ *, *"[a-zA-Z0-9]+" *, *[a-zA-Z0-9]+![a-zA-Z0-9]+\.[a-zA-Z0-9]+ *}\)

依旧替换为GetCommentForReport(\1, "ReportConnection0107")

解释:VS除了NotePad++/EditPlus的问题外,还有一个严重的问题就是他抓取的不是分组(),而是抓获的花括号{}抓捕的字符串,官方的称呼叫做“带标记的表达式”,详情可以参考MSDN?正则表达式 (Visual Studio) 。

PS

所以咯,Vimer,你懂的~

原文地址:http://dddspace.com/2011/01/regex-group-catch.html