当前位置: 代码迷 >> ASP.NET >> asp.net用正则表达式取<td>里边<span>标签的值
  详细解决方案

asp.net用正则表达式取<td>里边<span>标签的值

热度:5442   发布时间:2013-02-25 00:00:00.0
asp.net用正则表达式取<td>里面<span>标签的值
如:

string str = @"<table id=""tableId"">

  <tr><td><span>2</span>期</td></tr>

  <tr><td ><span>第一期</span><span>第二期</span><span>第三期</span><span>第四期</span><span>第五期</span><span>第六期</span><span>第七期</span></td></tr>

  <tr><td><label>时间: 2012-09-16 21:30</label></td></tr></table>";



我现在只会取到<td>里面的值,把<span>标签也给取出来了。这样实现的:

Regex reg = new Regex(@"(?is)<table[^>]*?id=""tableId""[^>]*?>(?:\s*<tr>(?:\s*<td[^>]*?>(.*?)</td>){1}\s*</tr>)*\s*</table>");

  foreach (Capture c in reg.Match(strHtml).Groups[1].Captures)

  {

  result += c.Value + "|";

  }

而我想得到<span>里面的值(取值的时候不带<span>标记,直接取里面的值),请问如何写正则表达式,谢谢!


------解决方案--------------------------------------------------------
C# code
string strHtml = @"<table id=""tableId"">  <tr><td><span>2</span>期</td></tr>  <tr><td ><span>第一期</span><span>第二期</span><span>第三期</span><span>第四期</span><span>第五期</span><span>第六期</span><span>第七期</span></td></tr>  <tr><td><label>时间: 2012-09-16 21:30</label></td></tr></table>";            string result=string.Empty;                        string pattern = @"(?i)(?<=<table[^>]*?id=['""]?tableId['""]?[^>]*?>(?:(?!</?table>)[\s\S])*?<span>)[^<>]+?(?=</span>)";            result = string.Join("|", Regex.Matches(strHtml,pattern).Cast<Match>().Select(a=>a.Value));            //2|第一期|第二期|第三期|第四期|第五期|第六期|第七期