当前位置: 代码迷 >> ASP.NET >> C#靠山解析aspx原页面的标签
  详细解决方案

C#靠山解析aspx原页面的标签

热度:5134   发布时间:2013-02-25 00:00:00.0
C#后台解析aspx原页面的标签
是这样的,
我已经获取了指定页面a.aspx的内容,是读取文件内容
在后台是经过处理的字符串,
目的是想获取该页面的指定标签的内容,
比如:获取该页面上所有的按钮的列表,
求思路:能给出示例代码更好

------解决方案--------------------------------------------------------
是要做数据采集?数据采集用正则
所有按钮的列表。查找所有按钮也可以用正则么。

没太懂。帮顶吧。
------解决方案--------------------------------------------------------
如果获取的是html代码,那就正则解析,要什么解析什么,什么网址啊,邮件啊,网上都有现成的
------解决方案--------------------------------------------------------
参见ms的PageParser 类

http://msdn.microsoft.com/zh-cn/library/system.web.ui.pageparser.aspx

http://reflector.webtropy.com/default.aspx/4@0/4@0/untmp/DEVDIV_TFS/Dev10/Releases/RTMRel/ndp/fx/src/xsp/System/Web/UI/PageParser@cs/1503810/PageParser@cs
------解决方案--------------------------------------------------------
用jquery来做应该更容易。
ajax请求你的网址,返回整个网页的数据。
比如里面有span标签:<span id="sp1">标题</span>
直接:$("#sp1").text();这样获取的就是id=“sp1”的标签里的内容。
-----------------------------------------------------------
asp.net做的大致思路是这样子的。
用WebRequest,请求网页,返回数据。
然后正则匹配,然后循环遍历。
参考代码:
C# code
var slReg = "这里是正则表达式";var SLData = "这里是通过请求返回的网页html代码";var SLStr = string.Empty;var SLmc = Regex.Matches(SLData, slReg);                    for (var i = 0; i < SLmc.Count; i++)                    {                        SLStr += SLmc[i].Value;                    }
  相关解决方案