1.字符串1:<aaa> <bbbb/> </ccc> 哈哈哈</aaa>
需要识别<aaa> <bbbb/> </ccc> </aaa> 4个标记(别把整句话 <aaa> <bbbb/> </ccc> 哈哈哈</aaa> 当一个标记识别了)
2.字符串2:哈哈哈www.aa.com哈哈http://www.aa.com/aa/a哈哈
需要识别www.aa.com和http://www.aa.com/aa/a 即将字符串中的url识别出来
3 字符穿3:哈哈哈C:\aaa\aaa.txt哈哈哈C:\aaa哈
需要识别C:\aaa\aaa.txt和C:\aaa 即将字符串中的文件路径识别出来
万分感谢!!!!!
------解决方案--------------------------------------------------------
1.多次匹配\<(?<rrrfff>[^\>]+)\>[^\<]*\<(\k<rrrfff>)\>,取得每个标签和其子标签。
2.匹配冒号、斜杠、点号和字母就行,很简单就不写了
3.看2
------解决方案--------------------------------------------------------
1. <[^>]*?>
2. (?i)(https?://)?www\.[^\s\u4e00-\u9fa5]+
3. (?i)[a-z]:\\[^\s\u4e00-\u9fa5]+