当前位置: 代码迷 >> Web开发 >> 正则表达式截取html,该如何解决
  详细解决方案

正则表达式截取html,该如何解决

热度:116   发布时间:2013-01-06 15:44:47.0
正则表达式截取html

1.现有超链接如下:<a href="products/F0/food/----------------------20----OFFSET5/2.html " rel="nofollow">Next</a>
  实现效果:截取超链接Next对应的href。

2.现有表格如下
  <table class="table-1">
      <tr>
          <th>Name</th>
      </tr>
      <tr>
 <th>Address</th>
      </tr>
      <tr>
 <th>Telephone</th>
      </tr>
  </table>
  实现效果:截取<th>Name</th>所在的<tr>

  注:请使用正则表达式(在C#中运行)
------解决方案--------------------
C# 正则:

1. (?i)(?<=<a\b[^>]*?href=(['"]?))[^'"]+(?=\1[^>]*?>Next</a>)
2. (?is)<tr>.*?<th>Name</th>.*?</tr>

js正则:

1.  var reg=/<a\b[^>]*?href=(['"]?)([^'"]+)\1[^>]*?>Next<\/a>/i; 取分组2的值
2.  var reg=/<tr>.*?<th>Name<\/th>.*?<\/tr>/i;
  相关解决方案