解決ASP.NET中的各種亂碼問題總結(jié)
經(jīng)常發(fā)現(xiàn)有人被亂碼困擾著,而我感覺比較幸運(yùn),很少為此煩惱過。
在這篇博客中,我將把我想到的一些與亂碼有關(guān)的經(jīng)驗(yàn)總結(jié)出來,供大家參考。
頁面顯示亂碼問題
在一個(gè)網(wǎng)站中,有些頁面會(huì)正常顯示,然而,有些頁面會(huì)顯示成亂碼。 如果發(fā)生這種情況,可以檢查一下web.config和文件編碼。
如果web.config是這樣配置的:
<globalization fileEncoding="utf-8" />
而文件的編碼不是UTF-8:
那么就會(huì)有亂碼問題。
注意:反之是不是會(huì)出現(xiàn)亂碼的。
1. 不設(shè)置fileEncoding,此時(shí)不會(huì)有亂碼現(xiàn)象。
2. fileEncoding="gb2312",文件以utf-8編碼,此時(shí)也不會(huì)有亂碼現(xiàn)象。
因此,我建議最好讓所有文件都以UTF-8編碼保存,從而解決這類亂碼問題。
AJAX提交的數(shù)據(jù)亂碼問題
AJAX技術(shù)流行了這么多年了,我想現(xiàn)在沒有幾個(gè)網(wǎng)站不使用這種技術(shù)的。 然而,有些人在使用AJAX時(shí),遇到了亂碼問題。
通過分析這類亂碼案例中,我發(fā)現(xiàn)幾乎都是采用這種方式向服務(wù)端提交數(shù)據(jù): “key1=” + escape(value1) +“&key2=” + escape(value2)
這種方法在多數(shù)情況下,的確能夠正常工作,然而遇到一些特殊字符,就行不通了。原因我后面再來解釋。
我為這類不正確的方法準(zhǔn)備了一個(gè)示例 (為了保持示例簡單,我演示一個(gè)拼接URL),
頁面代碼如下:
<p><a id="link2" href="#" target="_blank">escape</a></p> <script type="text/javascript"> var str = "aa=1&bb=" + escape("fish li + is me.") + "&cc=" + escape("大明王朝1368"); $("#link2").attr("href", "/test_url_decode.ashx?method=escape&" + str); </script>
服務(wù)端的代碼就是從QueryString讀取那些參數(shù)值,然后輸出。由于代碼實(shí)在太簡單,就不貼出了。(可下載示例代碼)
當(dāng)我點(diǎn)擊鏈接時(shí),服務(wù)端返回了這樣的結(jié)果:
注意:"fish li + is me." 中間的加號沒有了。
解決這個(gè)問題有個(gè)簡單的方法,那就是使用JQuery的$.param()方法,修改后的代碼如下:
<script type="text/javascript"> var myobject = { aa: 1, bb: "fish li + is me.", cc: "大明王朝1368" }; $("#link1").attr("href", "/test_url_decode.ashx?method=param&" + $.param(myobject)); </script>
另外,我非常反感拼接這種提交數(shù)據(jù):“key1=” + escape(value1) +“&key2=” + escape(value2)
因?yàn)檫@種代碼的可讀性太差了,在此,我建議在AJAX調(diào)用時(shí),最好直接使用JQuery的$.ajax方法向服務(wù)端提交數(shù)據(jù)。
請看下面的示例代碼(注意我為data屬性賦值的方式):
<p><a id="btnTestParam" href="javascript:void(0);">Click me! 【點(diǎn)擊我】</a></p> <div id="divResult"></div> <script type="text/javascript"> $(function() { $("#btnTestParam").click(function() { $.ajax({ url: "/TestParam.ashx", type: "GET", cache: false, data: { id: 2, name: "fish li + is me.", tel: "~!@#$%^&*()_+-=<>?|", "x?x!x&x": "aa=2&bb=3&cc=漢字。", // 特殊的鍵名,值內(nèi)容也特殊。 encoding: "見鬼去吧。?& :)", 中文鍵名: "大明王朝1368" }, success: function(responseText) { $("#divResult").html(responseText); } }); }); }); </script>
運(yùn)行結(jié)果:
JavaScript中正確的URL編碼方式
看過前面的示例,您有沒有想過:為什么escape不能解決的問題,JQuery就能解決呢?
對于這個(gè)問題,我想還是先來看看MSDN中關(guān)于escape的說明(截圖):
MSDN說的很清楚,我也沒有必要再做解釋。
不過,我想有人可能會(huì)問:我用POST提交數(shù)據(jù)呢?那可是不經(jīng)過URL的。
是的,POST數(shù)據(jù)時(shí),參數(shù)沒有放在URL中,但是,仍然采用URL編碼。
POST數(shù)據(jù)也采用URL編碼,是因?yàn)椋罕韱慰梢圆捎肎ET方式提交,那么數(shù)據(jù)將通過URL提交給服務(wù)器。
所以提交的數(shù)據(jù)都要經(jīng)過URL編碼。
我們再來看一下$.ajax是如何處理數(shù)據(jù)的提交過程的:
ajax: function( origSettings ) { var s = jQuery.extend(true, {}, jQuery.ajaxSettings, origSettings); // ............... 去掉一些無關(guān)的代碼 // convert data if not already a string if (s.data && s.processData && typeof s.data !== "string") { // 注意下面這個(gè)調(diào)用 s.data = jQuery.param( s.data, s.traditional ); }
再來看jQuery.param的實(shí)現(xiàn)過程:
// Serialize an array of form elements or a set of // key/values into a query string param: function( a, traditional ) { var s = []; // ............... 去掉一些無關(guān)的代碼 // If an array was passed in, assume that it is an array of form elements. if ( jQuery.isArray(a) || a.jquery ) { // Serialize the form elements jQuery.each( a, function() { add( this.name, this.value ); }); } else { // ............... 去掉一些非重點(diǎn)代碼 } // Return the resulting serialization return s.join("&").replace(r20, "+"); function add( key, value ) { // If value is a function, invoke it and return its value value = jQuery.isFunction(value) ? value() : value; s[ s.length ] = encodeURIComponent(key) + "=" + encodeURIComponent(value); } }
這段代碼的核心就是add函數(shù)的實(shí)現(xiàn)了,它在內(nèi)部調(diào)用了encodeURIComponent()函數(shù)。
我們應(yīng)該注意JQuery對數(shù)據(jù)的處理方式:encodeURIComponent(key) + "=" + encodeURIComponent(value);
JQuery在最后還把%20還替換成 + 號了。
在WEB開發(fā)領(lǐng)域,我想大家對JQuery的權(quán)威應(yīng)該不用懷疑吧? 所以我認(rèn)為JQuery的方法肯定是正確的。
從JQuery的實(shí)現(xiàn)方式也可以看出:encodeURI()其實(shí)也是不推薦在編碼URL數(shù)據(jù)時(shí)使用的。
說到這里,我要說說為什么不推薦使用encodeURI。
encodeURI用于對整個(gè)URL字符串進(jìn)行編碼,如果某個(gè)參數(shù)值本身包含一些特殊字符。
例如:key = "x?x/x&x", value = "aa=2&bb=3&cc=漢字。",這個(gè)函數(shù)的結(jié)果將會(huì)不正確。
它通常用于編碼URL路徑中包含有類似漢字這種場合,不適合處理URL參數(shù)。
但是,URL路徑中的目錄名與文件名,我們可以選擇英文字符,所以encodeURI通常沒有機(jī)會(huì)使用。
ASP.NET中正確的URL編碼方式
前面介紹了JavaScript中三種URL的編碼方式,在服務(wù)端,ASP.NET有更多的URL編碼方法,今天我也把服務(wù)端的編碼也做了個(gè)總結(jié),因?yàn)槲野l(fā)現(xiàn)網(wǎng)上有些資料也是錯(cuò)誤的。
在ASP.NET中提供三個(gè)URL編碼方法:HttpUtility.UrlPathEncode、HttpUtility.UrlEncode、Server.UrlEncode
.NET framework還提供了System.Uri這個(gè)類,它也有一些用于URL處理的方法。 比如EscapeUriString,EscapeDataString這二個(gè)方法,可用于URL路徑與參數(shù)的編碼任務(wù)。
面對這些方法,我該選擇哪個(gè)?
我建議在 ASP.NET 中,編碼查詢參數(shù) 時(shí)選擇HttpUtility.UrlEncode(str) ,并且在拼接URL時(shí),采用 HttpUtility.UrlEncode(key) + "=" + HttpUtility.UrlEncode(value) 的方法。如果要 編碼URL中的路徑,請使用HttpUtility.UrlPathEncode()
下面我來解釋前面不建議使用的另外的一些方法的原因:
1. Server.UrlEncode: 這個(gè)方法其實(shí)也是調(diào)用HttpUtility.UrlEncode,只是它會(huì)盡量使用Response.ContentEncoding所表示的編碼格式, 然而HttpUtility.UrlEncode(str)總是會(huì)使用UTF-8編碼,如果你不希望被字符編碼糾纏,那就應(yīng)該放棄Server.UrlEncode , 畢竟UTF-8編碼才是更好的選擇。
2. 雖然System.Uri的那二個(gè)編碼方法,也能實(shí)現(xiàn)我們需要的URL編碼任務(wù), 但是,當(dāng)ASP.NET在填充Request.QueryString, Request.Form時(shí),使用的解碼方法是HttpUtility.UrlDecode, 因此,如果你執(zhí)意選擇使用System.Uri的相關(guān)的編碼方法,顯然就不能與解碼方法匹配,后果如何就難說了。
正確的URL編碼方式的總結(jié)
由于編碼函數(shù)(方法)較多,而且又比較重要,我認(rèn)為有必要再做個(gè)總結(jié)。
一個(gè)完整的URL可以簡單地認(rèn)為包含二個(gè)部分:文件路徑(含目錄) 和 查詢參數(shù)(QueryString)
在編碼時(shí),一定要分開處理。
編碼文件路徑時(shí),應(yīng)該選擇 encodeURI,HttpUtility.UrlPathEncode 。
編碼查詢參數(shù)時(shí),應(yīng)該選擇 encodeURIComponent,HttpUtility.UrlEncode,而且拼接方式應(yīng)該是:Encode(key) + "=" + Encode(value)
絕對不能先把整個(gè)URL(包含查詢參數(shù))拼接起來了,再來考慮該選擇哪個(gè)編碼方法。
再說一遍:在JavaScript中使用escape肯定是錯(cuò)誤的。
徹底解決encodeURIComponent()與GB2312亂碼問題
前面我建議在JavaScript中使用encodeURIComponent()來處理提交數(shù)據(jù), 然而encodeURIComponent()在編碼字符時(shí),使用的是UTF-8編碼。 也正因?yàn)檫@個(gè)原因,有人可能會(huì)說:我的網(wǎng)站使用的編碼方式是gb2312 !
<globalization requestEncoding="gb2312" responseEncoding="gb2312" />
對于這個(gè)回答,我有時(shí)實(shí)在不想再說下去了:你就不能把網(wǎng)站的編碼改成UTF-8嗎?
現(xiàn)在好了,我設(shè)計(jì)了一種方法,可以解決在GB1212編碼的網(wǎng)站中使用encodeURIComponent(), 這個(gè)方法的設(shè)計(jì)思路比較直接:既然encodeURIComponent()是使用UTF-8編碼, 那么,我們是不是只要告訴服務(wù)端,客戶端提交的數(shù)據(jù)是UTF-8編碼的,此時(shí)服務(wù)端只要識別后,按照UTF-8編碼來解碼,問題就解決了。
理清了思路,代碼其實(shí)很簡單。首先來看客戶端的代碼。
$.ajax({ // 注意下面這行代碼,它為請求添加一個(gè)自定義請求頭 beforeSend: function(xhr) { xhr.setRequestHeader("x-charset", "utf-8"); }, url: "/TestParam.ashx", type: "GET", cache: false, data: { id: 2, name: "fish li + is me.", tel: "~!@#$%^&*()_+-=<>?|", "x?x!x&x": "aa=2&bb=3&cc=漢字。", // 特殊的鍵名,值內(nèi)容也特殊。 encoding: "見鬼去吧。?& :)", 中文鍵名: "大明王朝1368" }, success: function(responseText) { $("#divResult").html(responseText); } });
注意:在原來的基礎(chǔ)上,我只加了一行代碼:
beforeSend: function(xhr) { xhr.setRequestHeader("x-charset", "utf-8"); },
再來看服務(wù)端代碼。我寫了一個(gè)HttpModule來統(tǒng)一處理這個(gè)問題。
public class ContentEncodingModule : IHttpModule { public void Init(HttpApplication app) { app.BeginRequest += new EventHandler(app_BeginRequest); } void app_BeginRequest(object sender, EventArgs e) { HttpApplication app = (HttpApplication)sender; HttpWorkerRequest request = (((IServiceProvider)app.Context) .GetService(typeof(HttpWorkerRequest)) as HttpWorkerRequest); // 注意:我并沒有使用 app.Request.Headers["x-charset"] // 因?yàn)椋航^大部分程序不訪問它,它將一直保持是 null, // 如果我此時(shí)該問這個(gè)集合,會(huì)導(dǎo)致填充它。 // 我認(rèn)為填充Headers集合比我下面的調(diào)用的成本要高很多, // 所以,直接通過HttpWorkerRequest讀取請求頭對性能的損耗會(huì)最小。 string charset = request.GetUnknownRequestHeader("x-charset"); if( string.Compare(charset, "utf-8", StringComparison.OrdinalIgnoreCase) == 0 ) // ASP.NET在填充QueryString,Form時(shí),會(huì)訪問Request.ContentEncoding做為解碼時(shí)使用的字符編碼 app.Request.ContentEncoding = System.Text.Encoding.UTF8; }
改造后的結(jié)果是:除非客戶端明確添加"x-charset"請求頭,否則還是按原來的方式處理,對于服務(wù)端代碼來說,完全不用修改。
說明:
1. 如果網(wǎng)站的提交全部采用JQuery,也可以統(tǒng)一設(shè)置,這是JQuery支持的功能。
2. 如果使用JQuery1.5以上版本,也可以寫成:headers: {"x-charset" : "utf-8"}
3. 就算以后網(wǎng)站使用UTF-8編碼,所有代碼不需要做任何修改。
Cookie亂碼問題
前段時(shí)間,有人在博客的評論中問我:asp.net服務(wù)器端寫中文cookie,js客戶端讀取時(shí)亂碼。
其實(shí)這個(gè)問題還是比較好解決的,方法是:寫Cookie時(shí)用HttpUtility.UrlEncode編碼,然后在客戶端使用decodeURIComponent把內(nèi)容轉(zhuǎn)回來就可以了。 在此,我推薦使用jquery.cookie.js這個(gè)插件來讀寫Cookie。 示例代碼如下(前端):
$(function() { var cookie = $.cookie("TestJsRead"); $("#cookieValue").text(cookie); });
服務(wù)端代碼:
cookie = new HttpCookie("TestJsRead", HttpUtility.UrlEncode("大明王朝1368")); Response.Cookies.Add(cookie);
下載文件名亂碼問題
有時(shí)我們需要在程序運(yùn)行時(shí)動(dòng)態(tài)的創(chuàng)建文件,并讓用戶下載這個(gè)在運(yùn)行時(shí)產(chǎn)生的文件, 然而,有時(shí)候用戶會(huì)要求程序能生成一個(gè)默認(rèn)的文件名,方便他們保存。 此時(shí),我們只需要設(shè)置Content-Disposition這個(gè)響應(yīng)頭,并給一個(gè)默認(rèn)的文件名就可以了。
一般說來,我們只要讓默認(rèn)的下載文件名是英文及數(shù)字,問題永遠(yuǎn)不會(huì)出現(xiàn), 但是,有時(shí)候用戶可能要求默認(rèn)的文件中包含漢字, 最終,問題也隨之發(fā)生了。 請看下面的代碼:
public void ProcessRequest(HttpContext context) { byte[] fileContent = GetFileContent(); context.Response.ContentType = "application/octet-stream"; string downloadName = "ClownFish性能測試結(jié)果.xlsx"; string headerValue = string.Format("attachment; filename=\"{0}\"", downloadName); context.Response.AddHeader("Content-Disposition", headerValue); context.Response.OutputStream.Write(fileContent, 0, fileContent.Length); }
這段代碼在我的FireFox, Opera, Safari, Chrome都能正常運(yùn)行,其中FireFox顯示的下載對話框也是我期待的樣子:
遺憾的是,在我的IE8中是這樣的:
對于這個(gè)亂碼問題,我們需要把代碼做一點(diǎn)修改:
string downloadName = "ClownFish性能測試結(jié)果.xlsx"; if( context.Request.Browser.Browser == "IE" ) downloadName = HttpUtility.UrlPathEncode(downloadName);
此時(shí)IE顯示的文件名就不是亂碼了。
說明:我的機(jī)器環(huán)境是 Windows Server 2003 SP2, 用于測試的瀏覽器版本分別為:
多語言數(shù)據(jù)的亂碼問題
現(xiàn)在還有一種亂碼問題是:同一個(gè)程序供多種不同字符集(語言)的用戶在使用。
例如:程序是簡體中文的,此時(shí),繁體中文的用戶無法保存繁體漢字(就算簡體漢字能正常顯示)。
當(dāng)發(fā)現(xiàn)這種現(xiàn)象時(shí),需要檢查一下數(shù)據(jù)庫的字段類型,是否是Unicode或者UTF-8, 因?yàn)楫?dāng)數(shù)據(jù)字段的字符集不支持多種語言時(shí),亂碼問題必定產(chǎn)生。
我建議在使用SQL SERVER時(shí),保存文字的字段都使用N開頭的類型, 如:nvarchar, nchar,除非明確知道要保存郵政編碼或者md5值,才有必要使用char(xxx)這種數(shù)據(jù)類型。 類似的,在MySQL中,我建議使用UTF-8
亂碼問題的總結(jié)
ASP.NET的亂碼問題一般與二個(gè)因素有關(guān):
1. 選擇了不恰當(dāng)?shù)淖址幋a,如:gb2312
2. 選擇了不正確的URL編碼方法,如:escape()
因此,解決方案其實(shí)也不難:
1. 字符編碼選擇 utf-8 ,包含文件編碼,請求/響應(yīng)編碼,數(shù)據(jù)庫字段類型。
2. URL編碼方法選擇encodeURIComponent,再次強(qiáng)烈推薦直接使用JQuery
我一直認(rèn)為:正確的方法可以讓我在無形中避開許多問題。
如果你還為亂碼問題而煩惱,我建議你先想想你是否選擇了不正確的編碼(方法)。
點(diǎn)擊此處下載示例代碼:demo
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
win10下ASP.NET Core部署環(huán)境搭建步驟
這篇文章主要以圖文結(jié)合的方式介紹了win10下ASP.NET Core部署環(huán)境搭建步驟,感興趣的小伙伴們可以參考一下2016-07-07asp.net實(shí)現(xiàn)在XmlTextWriter中寫入一個(gè)CDATA的方法
這篇文章主要介紹了asp.net實(shí)現(xiàn)在XmlTextWriter中寫入一個(gè)CDATA的方法,結(jié)合實(shí)例形式分析了XmlTextWriter寫入CDATA的步驟與相關(guān)實(shí)現(xiàn)技巧,需要的朋友可以參考下2016-04-04詳解在Azure上部署Asp.NET Core Web App
這篇文章主要介紹了詳解在Azure上部署Asp.NET Core Web App,小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧2017-12-12asp.net中ADO SQL數(shù)據(jù)庫 筆記匯總 持續(xù)更新中
asp.net中ADO SQL數(shù)據(jù)庫 筆記匯總 持續(xù)更新中,需要的朋友可以參考下2012-07-07詳解如何創(chuàng)建一個(gè).NET Core工程
本文主要介紹了如何創(chuàng)建一個(gè).NET Core工程,文中根據(jù)實(shí)例編碼詳細(xì)介紹的十分詳盡,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2022-03-03