当前位置: 代码迷 >> Web前端 >> 地址栏传接中文字符
  详细解决方案

地址栏传接中文字符

热度:159   发布时间:2012-10-31 14:37:32.0
地址栏传递中文字符

/*
 Filename: encode.js
 Function:
   encodechinese(uri) 
     - 将字符串(包括中文)转换成能在url中传递的字符串,接收方需要先用base64解码再对得到的      application/x-www-form-urlencoded 字符串解码。
   utf16to8(str) 
     - 将 UTF-16 编码转换成 UTF-8 编码
   utf8to16(str) 
     - 将 UTF-8 编码转换成 UTF-16 编码
   base64encode(str) 
     - base64 编码 
   base64decode(str) 
     - base64 解码
 Usage:
   对要传递的字符串用encodechinese进行编码后传递。
   服务器端要按顺序解码。例如:
   java:
    endodedString = (String) request.getParameter("search_loginId");
    BASE64Decoder decoder = new BASE64Decoder()
    endodedString = new String(decoder.decodeBuffer(endodedString));
    return URLDecoder.decode(endodedString, "utf-8");
 Description:
    javascript 中的汉字和英文一样,都是作为一个字符处理的(采用的 UTF-16 编码),而服务端程序中却
   把中文作为多个字符处理(比如 UTF-8 的中文会认为是 3 个字符),而 javascript 那个序列化程序在序列
   化时会把中文按照英文进行个数统计,所以如果用 encodeURIComponent 编码虽然可以正确传递给服务
   器端的程序,但是在 PHP 中接序列化时,还是不正确。如果把 javascript 中那个序列化函数中的中文字符
   串用 endode.js 中的 utf16to8 函数转化为 UTF-8 格式的话,在进行个数统计,这样得到的序列化对象中
   中文字符串的长度会跟服务端程序中的一致,但是这个不能用 encodeURIComponent 编码传递给服务器
   端,要用 escape 进行传递才能正确。
    也就是说 escape(utf16to8(str)) 跟 encodeURIComponent(str) 的结果一样。都可以正确的将中文以 
   UTF-8 格式传给服务器端。但对于序列化对象用 escape 和 utf16to8 的组合更好,因为在这两步之间可以
   插入字符统计操作。
    但是这种编码带来的问题是对于带有许多中文的或非英文符号的字符串编码后得到的字符串会很长,而
   用 HTTP GET 提交的内容长度有限,所以尽量短才好,所以先用 base64 对 utf16to8 之后的字符串进行编
   码,然后再用escape 或者 encodeURIComponent 对编码后的字符串在编码的话,得到的字符串就会短
   一些了。而最后这一步需要作的也就是把加号转化为%2B,对于 base64 编码中的 / 和 = 这两个字符一般
   不需要转化,因为它们在参数格式正确的情况下不会引起问题(因为 base64 编码中没有 & 符号,所以
    = 不会引起问题)。当然对这两个符号也进行转化(也就是用 escape 编码)当然会更安全,但是得到的
    编码长度可能又会长一些。
*/
/*
 服务器端使用以下代码调用:
  CNVP.Base64.MyBase64 base64 = new CNVP.Base64.MyBase64();
  Keyword=base64.base64Decode(Keyword);
*/
function encodechinese(uri) {
 // 先转换成UTF8再转换成application/x-www-form-urlencoded 格式,再用base64编码。
 var Keyword = base64encode(escape(utf16to8(uri)));
 //替换+,否则在服务器解码的时候会出错
 Keyword = Keyword.replace("+", "%2B");
 return Keyword;
}
function utf16to8(str) {
 var out, i, len, c;
 out = "";
 len = str.length;
 for (i = 0; i < len; i++) {
  c = str.charCodeAt(i);
  if ((c >= 1) && (c <= 127)) {
   out += str.charAt(i);
  } else {
   if (c > 2047) {
    out += String.fromCharCode(224 | ((c >> 12) & 15));
    out += String.fromCharCode(128 | ((c >> 6) & 63));
    out += String.fromCharCode(128 | ((c >> 0) & 63));
   } else {
    out += String.fromCharCode(192 | ((c >> 6) & 31));
    out += String.fromCharCode(128 | ((c >> 0) & 63));
   }
  }
 }
 return out;
}
function utf8to16(str) {
 var out, i, len, c;
 var char2, char3;
 out = "";
 len = str.length;
 i = 0;
 while (i < len) {
  c = str.charCodeAt(i++);
  switch (c >> 4) {
    case 0:
    case 1:
    case 2:
    case 3:
    case 4:
    case 5:
    case 6:
    case 7:
     // 0xxxxxxx
   out += str.charAt(i - 1);
   break;
    case 12:
    case 13:
       // 110x xxxx   10xx xxxx
   char2 = str.charCodeAt(i++);
   out += String.fromCharCode(((c & 31) << 6) | (char2 & 63));
   break;
    case 14:
       // 1110 xxxx  10xx xxxx  10xx xxxx
   char2 = str.charCodeAt(i++);
   char3 = str.charCodeAt(i++);
   out += String.fromCharCode(((c & 15) << 12) | ((char2 & 63) << 6) | ((char3 & 63) << 0));
   break;
  }
 }
 return out;
}
/*
 下面是关于Js进行Base64编码和解码的相关操作:
*/
var base64EncodeChars = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/";
var base64DecodeChars = new Array(-1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, 62, -1, -1, -1, 63, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, -1, -1, -1, -1, -1, -1, -1, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, -1, -1, -1, -1, -1, -1, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, -1, -1, -1, -1, -1);
//客户端Base64编码
function base64encode(str) {
 var out, i, len;
 var c1, c2, c3;
 len = str.length;
 i = 0;
 out = "";
 while (i < len) {
  c1 = str.charCodeAt(i++) & 255;
  if (i == len) {
   out += base64EncodeChars.charAt(c1 >> 2);
   out += base64EncodeChars.charAt((c1 & 3) << 4);
   out += "==";
   break;
  }
  c2 = str.charCodeAt(i++);
  if (i == len) {
   out += base64EncodeChars.charAt(c1 >> 2);
   out += base64EncodeChars.charAt(((c1 & 3) << 4) | ((c2 & 240) >> 4));
   out += base64EncodeChars.charAt((c2 & 15) << 2);
   out += "=";
   break;
  }
  c3 = str.charCodeAt(i++);
  out += base64EncodeChars.charAt(c1 >> 2);
  out += base64EncodeChars.charAt(((c1 & 3) << 4) | ((c2 & 240) >> 4));
  out += base64EncodeChars.charAt(((c2 & 15) << 2) | ((c3 & 192) >> 6));
  out += base64EncodeChars.charAt(c3 & 63);
 }
 return out;
}
//客户端Base64解码
function base64decode(str) {
 var c1, c2, c3, c4;
 var i, len, out;
 len = str.length;
 i = 0;
 out = "";
 while (i < len) {
  /* c1 */
  do {
   c1 = base64DecodeChars[str.charCodeAt(i++) & 255];
  } while (i < len && c1 == -1);
  if (c1 == -1) {
   break;
  }
  /* c2 */
  do {
   c2 = base64DecodeChars[str.charCodeAt(i++) & 255];
  } while (i < len && c2 == -1);
  if (c2 == -1) {
   break;
  }
  out += String.fromCharCode((c1 << 2) | ((c2 & 48) >> 4));
  /* c3 */
  do {
   c3 = str.charCodeAt(i++) & 255;
   if (c3 == 61) {
    return out;
   }
   c3 = base64DecodeChars[c3];
  } while (i < len && c3 == -1);
  if (c3 == -1) {
   break;
  }
  out += String.fromCharCode(((c2 & 15) << 4) | ((c3 & 60) >> 2));
  /* c4 */
  do {
   c4 = str.charCodeAt(i++) & 255;
   if (c4 == 61) {
    return out;
   }
   c4 = base64DecodeChars[c4];
  } while (i < len && c4 == -1);
  if (c4 == -1) {
   break;
  }
  out += String.fromCharCode(((c3 & 3) << 6) | c4);
 }
 return out;
}
  相关解决方案