我們知道JSP頁面是需要轉(zhuǎn)換為servlet的,在轉(zhuǎn)換過程中肯定是要進(jìn)行編碼的。在JSP轉(zhuǎn)換為servlet過程中下面一段代碼起到至關(guān)重要的作用。
<%@ page language="java" contentType="text/html; charset=UTF-8" pageEncoding="GBK" %>
在上面代碼中有兩個地方存在編碼:pageEncoding、contentType的charset。其中pageEncoding是jsp文件本身的編碼,而contentType的charset是指服務(wù)器發(fā)送給客戶端時的內(nèi)容編碼。
在前面一篇博客中就提到過(java中文亂碼解決之道(四)—–java編碼轉(zhuǎn)換過程)jsp在轉(zhuǎn)換為Servlet的過程中是需要經(jīng)過主要的三次編碼轉(zhuǎn)換過程(除去數(shù)據(jù)庫編碼轉(zhuǎn)換、頁面參數(shù)輸入編碼轉(zhuǎn)換):
第一次:轉(zhuǎn)換為.java文件;
第二次:轉(zhuǎn)換為.class文件;
第三次:業(yè)務(wù)邏輯處理后輸出。
JVM將JSP編譯為.jsp文件。在這個過程中pageEncoding就起到作用了,JVM首先會獲取pageEncoding的值,如果該值存在則采用它設(shè)定的編碼來編譯,否則則采用file.encoding編碼來編譯。
JVM將.java文件轉(zhuǎn)換為.class文件。在這個過程就與任何編碼的設(shè)置都沒有關(guān)系了,不管JSP采用了什么樣的編碼格式都將無效。經(jīng)過這個階段后.jsp文件就轉(zhuǎn)換成了統(tǒng)一的Unicode格式的.class文件了。
后臺經(jīng)過業(yè)務(wù)邏輯處理后將產(chǎn)生的結(jié)果輸出到客戶端。在這個過程中contentType的charset就發(fā)揮了功效。如果設(shè)置了charset則瀏覽器就會使用指定的編碼格式進(jìn)行解碼,否則采用默認(rèn)的ISO-8859-1編碼格式進(jìn)行解碼處理。流程如如下:
更多建議: