当前位置: 代码迷 >> Java Web开发 >> Jsoup 爬不已 iframe 中的内容
  详细解决方案

Jsoup 爬不已 iframe 中的内容

热度:1129   发布时间:2016-04-16 21:33:47.0
Jsoup 爬不了 iframe 中的内容
我正在试图分析一个网页,网页里面,内嵌了一个 iframe。

iframe 里面有 body, 那个 body 里面有想要的内容。

可是每次只能获得 iframe 这个节点,但是节点里面的内容就获得不了了。


------解决思路----------------------
简单的写了下,运行下试试,这样是可以获取的,不知道符合不?

@Test
public void aa() {
String html = "<html><head><title>First parse</title></head>"
+ "<body><iframe><html><body>Parsed HTML into a doc.</body></html></iframe></body></html>";

Document doc = Jsoup.parse(html);
String body = doc.select("iframe").first().text();// 得到ifrmae下的html字符串
Document ifmDoc = Jsoup.parseBodyFragment(body); // 将html字符串转成Document对象
// System.out.println(ifmDoc);
String ibody = ifmDoc.select("body").text();
System.out.println(ibody);
}
  相关解决方案