我正在试图分析一个网页,网页里面,内嵌了一个 iframe。
iframe 里面有 body, 那个 body 里面有想要的内容。
可是每次只能获得 iframe 这个节点,但是节点里面的内容就获得不了了。
------解决思路----------------------
简单的写了下,运行下试试,这样是可以获取的,不知道符合不?
@Test
public void aa() {
String html = "<html><head><title>First parse</title></head>"
+ "<body><iframe><html><body>Parsed HTML into a doc.</body></html></iframe></body></html>";
Document doc = Jsoup.parse(html);
String body = doc.select("iframe").first().text();// 得到ifrmae下的html字符串
Document ifmDoc = Jsoup.parseBodyFragment(body); // 将html字符串转成Document对象
// System.out.println(ifmDoc);
String ibody = ifmDoc.select("body").text();
System.out.println(ibody);
}