有一个需求,想要把带html标签的字符串中的纯文本内容做截取,尝试使用Jsoup ,版本是 jsoup-1.6.0.jar , 使用起来确实方便,但发现一个问题 ,标签中内容如果只有一个0 的话Jsoup居然不认,很奇怪
?
String html = "<span lang=EN-US>0</span>"; Document doc = Jsoup.parse(html); Elements eles = doc.getElementsByTag("span"); Element span = eles.get(0); System.out.println(span.hasText());//false System.out.println(span.ownText());//空串
?
暂时没有好的解决办法。
?
--------------------
哈哈 , Stackoverflow 真强大,问题刚发就有人回应,一楼的哥们说是jsoup的bug,他用jsoup-1.3.3就正常。我试了一下,还真是 。但有一个问题是我用了Element.clone()方法,1.3.3的版本还不支持,我继续试了更新的版本,最好又支持clone方法又没有这个bug。结果发现是在1.6的时候新出的bug,所以可以使用1.6之前最新的版本 jsoup-1.5.2.jar ,哈,问题解决了。
?
注:
1. 问题放到了Stackoverflow 上,呵呵,第一次去那儿;
2. 初步感觉Stackoverflow上面问问题比je的问答频道更好些,呵呵。