一直对字符集都理解的不是很清楚,有时候遇到就是不停的试,但好象结果经常不一样,
这里举XML为例, XML的头、XML文字的字符集和XML文件的字符集(就是另存为时可以看到的文件字符集)之间是什么关系?
下面是XML中有中文时的情况:
如果文件头是UTF-8,文件字符集ANSI,文件文字是UTF-8,这样XML就会无法解析,是一个不正确的XML格式;
如果文件头是GB2312,文件字符集是UTF-8,文件文字是UTF-8,里面的中文会乱码...
反正经常是不同的组合有不同的现象;
JAVA文件中,如果String s = "abc"; 那么这个abc是什么字符集? 跟操作系统字符集一样还是ISO8859-1?
有什么方法查询一个字符串的字符集吗?
------解决方案--------------------
参考这个 一段检测字节数组的编码方式的代码
很准确的