字符编码有关问题求解_J2SE

字符编码问题求解


import java.io.UnsupportedEncodingException;

public class mainTest {

	/**
	 * @param args
	 */
	public static void main(String[] args) {
		String string = "解析①②";
		try {
			System.out.println(new String(string.getBytes("EUC-JP"), "EUC-JP"));
			System.out.println(new String(string.getBytes("SHIFT-JIS"), "SHIFT-JIS"));
			System.out.println(new String(string.getBytes("ISO-2022-JP"), "ISO-2022-JP"));
			System.out.println(new String(string.getBytes("MS932"), "MS932"));
			System.out.println(new String(string.getBytes("GBK"), "GBK"));
		} catch (UnsupportedEncodingException e) {
			e.printStackTrace();
		}
	}
}

为什么前三个输出字符①②变成了乱码，而后2个输出就没有问题呢？该怎么解决乱码问题呢？

EUC-JP里面根本就没有①②这两个字符System.out.println(new String(string.getBytes("EUC-JP"), "EUC-JP"));
从Unicode编码的字符串取得EUC-JP bytes,
再从EUC-JP bytes到Unicode编码的字符串，
过程没有错，错的原因是EUC-JP不支持出现筹码的那几个字符①②又不是assci码，不是你随意用字符编码就能显示的。比如新建一个xml文件，内容为<h>中国</h>保存后，用ie或者火狐打开，会有乱码吧？重新打开文件，另存为，指定编码，比如utf-8。再打开或许就正常了，乱码不乱码，要看你文件编码和IDE编码是否同意，知道文件编码，你可以修改浏览器的编码，查看--字符编码--修改为和你文件一致的编码，就不会有乱码问题。试试UTF-8,很想知道UTF的是否支持。