编码有关问题的介绍_Java相关

编码问题的介绍

首先我使用的开发环境是Eclipse.创建一个Java Project默认的编码则为GBK，如图：

下面便是具体代码：

 1 import java.io.UnsupportedEncodingException; 2  3 public class Demo1 { 4     public static void main(String[] args) throws UnsupportedEncodingException { 5         String s = "我爱ABC"; 6         byte[] bytes1 = s.getBytes("gbk");//不写编码，则使用平台的默认字符集将此 String 编码为 byte序列，并返回byte[]. 7         //s.getBytes(Charset charset) 使用给定的charset将此String编码到byte序列； 8         //返回的是一个byte[]字节数组 9         10         for(byte b: bytes1){11             System.out.print(Integer.toHexString(b&0xff)+" ");12             //Integer.toHexString(int i)以十六进制（基数 16）无符号整数形式返回一个整数参数的字符串表示形式13         }14         //gbk编码中文占有两个字节，英文占有一个字节15         System.out.println();16         byte[] bytes2 = s.getBytes("utf-8");17         for(byte b: bytes2){18             System.out.print(Integer.toHexString(b&0xff)+" ");19         }20         //utf-8编码 中文占有三个字节，英文占有一个字节21         System.out.println();22         //java是双字节编码 --->utf-16be >> 中文和英文都占有两个字节23         byte[] bytes3 = s.getBytes("utf-16be");24         for(byte b: bytes3){25             System.out.print(Integer.toHexString(b&0xff)+" ");26         }27         28         /*当你的字节序列是某种编码时，这个时候想把字节序列变成29          *字符串，也需要用这种编码方式，否则会出现乱码30          * */31         System.out.println();32         String str1 = new String(bytes3);//用项目默认的编码即（GBK编码）  ----->> bytes3在上面定义成“utf-16be”的编码了，所以会出现乱码33         System.out.println(str1);34         System.out.println();35         36         String str2 = new String(bytes3,"utf-16be");37         System.out.println(str2);38         39       /*40        * 文本文件就是字节序列41        * 可以是任意编码的字节序列42        * 如果我们在中文机器上直接创建文本文件，那么该文本文件只认识ansi编码43        * 44       */    45     }46 }

打印的结果：

总的来说，编码必须对应，不然会出现乱码。