当前位置: 代码迷 >> Java Web开发 >> 远程抓取的页面内容为乱码,该如何处理
  详细解决方案

远程抓取的页面内容为乱码,该如何处理

热度:63   发布时间:2016-04-17 13:24:51.0
远程抓取的页面内容为乱码
我在jsp页面中通过远程抓取页面内容,如果源文件没有乱码,抓取的内容也不会出现乱码.如果那个页面的源文件就有乱码的话,我用什么方法能把它转换过来呢.在线等,解决了马上给各位加分...........

------解决方案--------------------
你问的问题太专业了, 只能顶你一下好了
------解决方案--------------------
有个开源的东西你可以试试.httpParser.这个东西就是专门解析html页面的

------解决方案--------------------
你可以换你抽取的页面内容转换成xml格式!其实用nekohtml就可以抽网页并转成xml格式的!
然后你可以用jdom进行解析你所想要的了!
  相关解决方案