JAVA代码中 ? ? ?java.net.URLencode 和 java.net.URLDecode
分别对应于
JavaScript 中的 encodeURI 和 decodeURI 、
? ? ? ? ? ? ? ? ? ? ? ? ? encodeURIComponent 和 decodeURIComponent.
?
?
原文地址:http://www.blogjava.net/hummer008/articles/213910.html
?
?
?
?
1.???????使用?JS?中的?encodeURIComponent?或?encodeURI?方法。
说明:
?
encodeURIComponent(String)
对传递参数进行设置。不编码字符有?71?个:?!?,?'?,?(?,?)?,?*?,?-?,?.?,?_?,?~?,?0-9?,?a-z?,?A-Z?。
例:
var url = “<a href=’http://cancait.blog.163.com/name=” + encodeURIComponent(“?中国?”) + “’>?中国?</a>”;
?
encodeURI(String)
对?URL?整体转换。不编码字符有?82?个:?!?,?#?,?$?,?&?,?'?,?(?,?)?,?*?,?+?,,,?-?,?.?,?/?,?:?,?;?,?=?,???,?@?,?_?,?~?,?0-9?,?a-z?,?A-Z?。
例:
var url = “<a href=’” + encodeURI(“http://cancait.blog.163.com/name=?中国?”) + “’>?中国?</a>”;
?
乱码处理实例:
/////////////////////////////////////////////////////////////////////////////////////
初始页面内容如下?(hello.jsp)?:
/////////////////////////////////////////////////////////////////////////////////////
<%@ page language="java" import="java.util.*" pageEncoding="GB18030"%>
<%String path = request.getContextPath();%>
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
?? <head>
???? <title>AJAX?提交页面?</title>
<meta http-equiv="Content-Type" content="text/html; charset=GB18030">
??? <script type="text/javascript">
???? function justdo(){
?? var post="name=?王力猛?&email=wallimn@sohu.com&bokee=http://wallimn.bokee.com?";
?? post = encodeURI(post);
?? post = encodeURI(post);//?两次,很关键?
?? var xmlObj = new ActiveXObject('Msxml2.XMLHTTP');
?? var URL = '<%= path%>/page/act.jsp';//?文件名需要调整成测试时的相应位置??
?? xmlObj.open ('post'?,?URL?,?true);
?? xmlObj.setrequestheader("cache-control"?,?"no-cache");?
?? xmlObj.setrequestheader("Content-Type"?,?"application/x-www-form-urlencoded");
?? xmlObj.send (post);//?注意?:POST?方式,使用这个来发送内容??
??? }
??? </script>?
?? </head>??
?? <body>
?? <input type="button" value="?提交?" onclick="justdo()"/>
??? </body>
</html>
/////////////////////////////////////////////////////////////////////////////////////
?ajax?请求处理页面(?act.jsp?)的内容如下?:
/////////////////////////////////////////////////////////////////////////////////////
<%@ page language="java" import="java.util.*" pageEncoding="GB18030"%>
<%String path = request.getContextPath();%>
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<?%@page?import="java.net.URLDecoder"%>
<html>
?? <head>
???? <title>ajax deal</title>
<meta http-equiv="pragma" content="no-cache">
<meta http-equiv="cache-control" content="no-cache">
<meta http-equiv="expires" content="0">????
?? </head>
?? <body>
?? <%
?? //?遍历输出参数内容。?
?? for (Enumeration e = request.getParameterNames(); e.hasMoreElements();) {
??? String h = (String) e.nextElement();
??? String v = request.getParameter(h);
??? String mm =?? java.net.URLDecoder.decode(v?,?"UTF-8");
??? System.out.println("?请求参数?: " + h + " = " + mm);
?? }
??? %>
?? </body>
</html>
/////////////////////////////////////////////////////////////////////////////////////
?
说明:
java.net.URLencode?和?java.net.URLDecode?分别对应于?JavaScript?中的?encodeURI?和?decodeURI?、?encodeURIComponent?和?decodeURIComponent.
?
为什么要连续两次调用?encodeURI(String)?方法呢?是因为?Java?中的?request.getParameter(String)?方法会进行一次?URI?的解码过程,调用时内置的解码过程会导致乱码出现。而?URI?编码两次后,?request.getParameter(String)?函数得到的是原信息?URI?编码一次的内容。接着用?java.net.URLDecoder.decode(String str,String codename)?方法,将已经编码的?URI?转换成原文。
2.???????使用?JS?中的?escape?方法。
说明:
escape(String)
对?0-255?以外的?unicode?值进行编码时输出?%u****?格式,其它情况下?escape?,?encodeURI?,?encodeURIComponent?编码结果相同。
例:
var url = “<a href=’http://cancait.blog.163.com/name=” + escape (“?中国?”) + “’>?中国?</a>”;
?
乱码处理实例:
/////////////////////////////////////////////////////////////////////////////////////
例子跟上面一样。只有这里不同。
(hello.jsp)
post = escape(post);
???post = escape (post);//?两次,很关键
???????
(act.jsp)
String h = (String) e.nextElement();
??? String v = request.getParameter(h);
String mm =???EscapeUnescape.unescape(?v?,?"UTF-8");
??? System.out.println("?请求参数?: " + h + " = " + mm);
/////////////////////////////////////////////////////////////////////////////////////
(EscapeUnescape.java)Java?中的?escape?和?unescape.?内容如下:
/////////////////////////////////////////////////////////////////////////////////////
package cn.kgnews.util;
?
public class?EscapeUnescape?{
public static String escape(String src) {
int i;
char j;
StringBuffer tmp = new StringBuffer();
tmp.ensureCapacity(src.length() * 6);
?
for (i = 0; i < src.length(); i++) {
?
????????j = src.charAt(i);
???????
????????if (Character.isDigit(j) || Character.isLowerCase(j)
????????????????|| Character.isUpperCase(j))
????????tmp.append(j);
????????else if (j < 256) {
????????tmp.append("%");
????????????????if (j < 16)
????????????????tmp.append("0");
????????tmp.append(Integer.toString(j?,?16));
????????} else {
????????tmp.append("%u");
????????tmp.append(Integer.toString(j?,?16));
????????}
????????}
return tmp.toString();
}
?
public static String unescape(String src) {
StringBuffer tmp = new StringBuffer();
tmp.ensureCapacity(src.length());
int lastPos = 0?,?pos = 0;
char ch;
while (lastPos < src.length()) {
????????pos = src.indexOf("%"?,?lastPos);
????????if (pos == lastPos) {
????????????????if (src.charAt(pos + 1) == 'u') {
????????????????ch = (char) Integer.parseInt(src
????????????????????????.substring(pos + 2?,?pos + 6)?,?16);
????????????????tmp.append(ch);
????????????????lastPos = pos + 6;
????????????????} else {
????????????????ch = (char) Integer.parseInt(src
????????????????????????.substring(pos + 1?,?pos + 3)?,?16);
????????????????tmp.append(ch);
????????????????lastPos = pos + 3;
????????????????}
????????} else {
????????????????if (pos == -1) {
????????????????tmp.append(src.substring(lastPos));
????????????????lastPos = src.length();
????????????????} else {
????????????????tmp.append(src.substring(lastPos?,?pos));
????????????????lastPos = pos;
????????????????}
????????}
????????}
return tmp.toString();
}
}
?
/////////////////////////////////////////////////////////////////////////////////////
说明:
EscapeUnescape.java?类是?Java?中的?escape?和?unescape?。
原理跟上例一样。
?
3.???????用?JavaScript?实现?java?中的?URLencode?跟?URLdecode.
说明:
这种方法服务器端代码不必修改。直接?request.getParameter()?来获取就可以了。
?
JavaScript?中的?URLencode?跟?URLdecode?实现如下:
?
/////////////////////////////////////////////////////////////////////////////////////
(UrlEncodeUrlDecode_gecko.js)?非?IE?实现方法如下:
完整代码可到这里下载:
http://www.blueidea.com/user/qswh/qswhU2GB.js
/////////////////////////////////////////////////////////////////////////////////////
var qswhU2GB = […..]; //?此数组为?GB Unicode?对照表
?
function UrlEncode(str){
var i?,?c?,?ret=""?,?strSpecial="!\"#$%&'()*+?,?/:;<=>?@[\]^`{|}~%";
for(i=0;i<str.length;i++){
if(str.charCodeAt(i)>=0x4e00){
????????c=qswhU2GB[str.charCodeAt(i)-0x4e00];
????????ret+="%"+c.slice(0?,?2)+"%"+c.slice(-2);
????????}
else{
????????c=str.charAt(i);
????????if(c==" ")
????????ret+="+";
????????else if(strSpecial.indexOf(c)!=-1)
????????ret+="%"+str.charCodeAt(i).toString(16);
????????else
????????ret+=c;
????????}
}
return ret;
}
function UrlDecode(str){
var i?,?c?,?d?,?t?,?p?,?ret = "";
?
function findPos(str){
for(var j = 0; j < qswhU2GB.length; j++){
????????if(qswhU2GB[j] == str){
????????return j;
????????}
????????}
return -1;
}
?
for(i = 0;i < str.length;){
????????c = str.charAt(i);i++;
if(c != "%"){
????????if(c == "+"){
????????ret += " ";
????????}else{
????????ret += c;
????????}
}else{
????????t = str.substring(i?,?i+2);i += 2;
????????if(("0x" + t) > 0xA0){
????????????????d = str.substring(i+1?,?i+3);i += 3;
????????????????p = findPos(t + d);
????????if(p != -1){
????????????????ret += String.fromCharCode(p + 0x4e00);
????????????????}
????????}else{
????????ret += String.fromCharCode("0x" + t);
????????}
????????}
}
return ret;
}
?
function getSpell(str?,?sp){
var i?,?c?,?t?,?ret="";
if(sp==null)sp="";
for(i=0;i<str.length;i++){
if(str.charCodeAt(i)>=0x4e00){
????????c=parseInt(qswhU2GB[str.charCodeAt(i)-0x4e00]?,?16);
????????if(c<55290){
????????for(t=qswhSpell.length-1;t>0;t=t-2)if(qswhSpell[t]<=c)break;
????????if(t>0)ret+=qswhSpell[t-1]+sp;
????????}
????????}
}
return ret.substr(0?,?ret.length-sp.length);
}
?
/////////////////////////////////////////////////////////////////////////////////////
(UrlEncodeUrlDecode_ie.js)IE?实现方法如下:
/////////////////////////////////////////////////////////////////////////////////////
function UrlEncode(str) {
var ret = "";
var strSpecial = " ~!\"#$%&'()*+-?,?/:;<=>?[]^`{|}~%";
for (var i = 0; i < str.length; i++) {
var chr = str.charAt(i);
strstr = chr;
execScript("c = hex(asc(strstr))"?,?"VBScript");
????????if (parseInt("0x" + c) > 127) {
????????ret += "%" + c.slice(0?,?2) + "%" + c.slice(-2);
????????} else {
????????if (strSpecial.indexOf(chr) != -1) {
????????ret += "%" + c.toString(16);
????????} else {
????????ret += chr;
????????}
????????}
}
return ret;
}
function UrlDecode(str) {
var ret = "";
for (var i = 0; i < str.length; i++) {
var chr = str.charAt(i);
????????if (chr == "+") {
????????ret += " ";
????????} else {
????????if (chr == "%") {
????????var asc = str.substring(i + 1?,?i + 3);
????????????????if (parseInt("0x" + asc) > 127) {
????????????????temp = parseInt("0x" + asc + str.substring(i + 4?,?i + 6));
????????????????execScript("rt = chr(temp)"?,?"VBScript");
????????????????ret += rt;
????????????????i += 5;
????????????????} else {
????????????????temp = parseInt("0x" + asc);
????????????????execScript("ret = ret + chr(temp)"?,?"VBScript");
????????????????i += 2;
????????????????}
????????} else {
????????ret += chr;
????????}
????????}
}
return ret;
}
?
/////////////////////////////////////////////////////////////////////////////////////
(loadcssorjs.js)?自动识别浏览器动态导入?JS/CSS
实现方法如下:
/////////////////////////////////////////////////////////////////////////////////////
/*
CopyRight(C)CAnca Software Office.
Created by CAnca.2007.9.4
*/
?
function LoadScript(url) {
document.write("<scr" + "ipt type=\"text/javascript\" src=\"" + url + "\" onerror=\"alert('Error loading ' + this.src);\"></scr" + "ipt>");
}
function LoadCss(url) {
document.write("<link href=\"" + url + "\" type=\"text/css\" rel=\"stylesheet\" onerror=\"alert('Error loading ' + this.src);\" />");
}
?
?
var sSuffix = /msie/.test(navigator.userAgent.toLowerCase()) ? "ie" : "gecko";
LoadScript("js/UrlEncodeUrlDecode_" + sSuffix + ".js");
?
使用方法:
将三个?JS?文件放在同目录。在页面导入?loadcssorjs.js?。在要进行编码的地方使用?UrlEncode?方法即可。
例:
//index.html
<html>
<head>
<script language=”javascript” src=”js/loadcssorjs.js”></script>
<script language=”javascript”>
????????var url = “?http://cancait.blog.163.com/name=?” +?UrlEncode?(“?中国人?”);
????????window.open(url);
</script>
</head>
<body>
…..
</body>
</html>
?
三种解决方案的比较:
?
第一种,?在服务器端需要一次?java.net.URLdecode(String)?转码。使用起来,不太方便。
第二种,?要建立?Java?版的?escape?跟?uncape?。在服务器端还是需要一次?uncape?转码。使用起来,不太方便。
第三种,?是最方便的一种方法。只需要客户端进行编码。服务器端可以不做任何修改。唯一缺点的是:?firefox?浏览网页时,要加载一个?150K?的?UrlEncodeUrlDecode_gecko.js?文件。影响了浏览速度。(但本人还是推荐使用这方案。)
?
总结:
当然,?Ajax?实现不乱码,可以不用这三种方案,用这三种方案,只是迫不得已的做法。通常造成乱码的原因有以下几点:
1.?xmlhttp??返回的数据默认的字符编码是?utf-8?,如果前台页面是?gb2312?或者其它编码数据就会产生乱码。
2.?post?方法提交数据默认的字符编码是?utf-8?,如果后台是?gb2312?或其他编码数据就会产生乱码。
?
解决方法:
?
推荐方法:由于?Javascript?沿用?java?的字符处理方式,内部是使用?unicode?来处理所有字符的。?前台后台都用?utf-8?编码,这样可以省不少麻烦,从根本上解决了乱码问题?.?优点是效率高,而且符合目前的形式,?utf-8?编码本身就是一种比较优秀的编码,没有语言限制?.?缺点只能调用自己的后台编码或者其他的?utf-8?的编码。
?
前台更改为
?
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
?
后台?asp?中第一行加入如下代码
span
?