如:
string str = @"<table id=""tableId"">
<tr><td><span>2</span>期</td></tr>
<tr><td ><span>第一期</span><span>第二期</span><span>第三期</span><span>第四期</span><span>第五期</span><span>第六期</span><span>第七期</span></td></tr>
<tr><td><label>时间: 2012-09-16 21:30</label></td></tr></table>";
我现在只会取到<td>里面的值,把<span>标签也给取出来了。这样实现的:
Regex reg = new Regex(@"(?is)<table[^>]*?id=""tableId""[^>]*?>(?:\s*<tr>(?:\s*<td[^>]*?>(.*?)</td>){1}\s*</tr>)*\s*</table>");
foreach (Capture c in reg.Match(strHtml).Groups[1].Captures)
{
result += c.Value + "|";
}
而我想得到<span>里面的值(取值的时候不带<span>标记,直接取里面的值),请问如何写正则表达式,谢谢!
------解决方案--------------------------------------------------------
- C# code
string strHtml = @"<table id=""tableId""> <tr><td><span>2</span>期</td></tr> <tr><td ><span>第一期</span><span>第二期</span><span>第三期</span><span>第四期</span><span>第五期</span><span>第六期</span><span>第七期</span></td></tr> <tr><td><label>时间: 2012-09-16 21:30</label></td></tr></table>"; string result=string.Empty; string pattern = @"(?i)(?<=<table[^>]*?id=['""]?tableId['""]?[^>]*?>(?:(?!</?table>)[\s\S])*?<span>)[^<>]+?(?=</span>)"; result = string.Join("|", Regex.Matches(strHtml,pattern).Cast<Match>().Select(a=>a.Value)); //2|第一期|第二期|第三期|第四期|第五期|第六期|第七期