网页是GBK编码的,我的JAVA控制台输出是UTF-8格式,现在获取网页源码后中文显示“?人????Т??????????????????”,用GBK转化后显示“[锟侥匡拷]锟戒汉锟斤拷锟斤拷孝锟斤拷士锟斤拷锟斤拷锟诫不锟斤拷锟斤拷植”;
如何进行转化,显示正常中文字体。。
byte[] bs = str.getBytes();
return new String(bs, newCharset); //用新的字符编码生成字符串
这种转化是不行的
------解决方案--------------------------------------------------------
用这个读:
BufferedReader br = new BufferedReader(new InputStreamReader(inputSteam,"GBK"));