当前位置: 代码迷 >> Web开发 >> 正则表达式截取html,该怎么处理
  详细解决方案

正则表达式截取html,该怎么处理

热度:89   发布时间:2012-08-16 12:02:15.0
正则表达式截取html

1.现有超链接如下:<a href="products/F0/food/----------------------20----OFFSET5/2.html " rel="nofollow">Next</a>
  实现效果:截取超链接Next对应的href。

2.现有表格如下
  <table class="table-1">
  <tr>
  <th>Name</th>
  </tr>
  <tr>
<th>Address</th>
  </tr>
  <tr>
<th>Telephone</th>
  </tr>
  </table>
  实现效果:截取<th>Name</th>所在的<tr>

  注:请使用正则表达式(在C#中运行)

------解决方案--------------------
C# 正则:

1. (?i)(?<=<a\b[^>]*?href=(['"]?))[^'"]+(?=\1[^>]*?>Next</a>)
2. (?is)<tr>.*?<th>Name</th>.*?</tr>

js正则:

1. var reg=/<a\b[^>]*?href=(['"]?)([^'"]+)\1[^>]*?>Next<\/a>/i; 取分组2的值
2. var reg=/<tr>.*?<th>Name<\/th>.*?<\/tr>/i;
  相关解决方案