java中文轉碼

發布時間: 2022-07-19 07:22:56

① java 怎麼把漢字轉換成utf-8編碼

漢字都需要用三位元組UTF-8解碼格式，也就是1110XXXX10XXXXXX10XXXXXX其中x為漢字Unicode二進制碼的前四位，中六位和後六位，分別提取出來，再組進格式里就完成了轉碼

② 關於JAVA中中文字元的轉碼問題

那是中文亂碼導致的。一種方法你可以再方法中加入：response.setCharacterEncoding("utf-8")
另一種方法：加入你獲取的參數是name,則獲取name轉換一下：
String name = 「%E4%B8%96%E7%95%8C";
String name2 = URLDecoder.decode(name);

③ java如何把string轉為utf-8

java不同編碼之間進行轉換，都需要使用unicode作為中轉。

String str = "任意字元串";

str = new String(str.getBytes("gbk"),"utf-8");

備注說明：

str.getBytes("UTF-8"); 意思是以UTF-8的編碼取得位元組

new String(XXX,"UTF-8"); 意思是以UTF-8的編碼生成字元串

舉例：

public static String getUTF8XMLString(String xml) {

// A StringBuffer Object

StringBuffer sb = new StringBuffer();

sb.append(xml);

String xmString = "";

String xmlUTF8="";

try {

xmString = new String(sb.toString().getBytes("UTF-8"));

xmlUTF8 = URLEncoder.encode(xmString, "UTF-8");

System.out.println("utf-8 編碼：" + xmlUTF8) ;

} catch (UnsupportedEncodingException e) {

// TODO Auto-generated catch block

e.printStackTrace();

}

// return to String Formed

return xmlUTF8;

(3)java中文轉碼擴展閱讀:

UTF-8編碼規則：

如果只有一個位元組則其最高二進制位為0；如果是多位元組，其第一個位元組從最高位開始，連續的二進制位值為1的個數決定了其編碼的位元組數，其餘各位元組均以10開頭。

實際表示ASCII字元的UNICODE字元，將會編碼成1個位元組，並且UTF-8表示與ASCII字元表示是一樣的。所有其他的UNICODE字元轉化成UTF-8將需要至少2個位元組。每個位元組由一個換碼序列開始。第一個位元組由唯一的換碼序列，由n位連續的1加一位0組成，首位元組連續的1的個數表示字元編碼所需的位元組數。

Unicode轉換為UTF-8時，可以將Unicode二進制從低位往高位取出二進制數字，每次取6位，如上述的二進制就可以分別取出為如下示例所示的格式，前面按格式填補，不足8位用0填補。

④ java 中文亂碼問題 utf-8和gbk的區別

Java中UTF-8轉GBK之所以不會出現中文亂碼，是因為UTF-8編碼為兼容性最大的字元集編碼，它本身就支持中文字元。

Java代碼轉碼範例：
String s = new String(ss.getBytes(),"GBK");
當你的內容本來就是正常的中文字元時，通過上面的語句轉為GBK編碼是不會有任何問題的，但如果你在轉碼之前的字元不是正確的中文字元，或者不是支持中文字元的字元集，那可能就會出現亂碼問題。

UTF-8（8-bit Unicode Transformation Format）是一種針對Unicode的可變長度字元編碼，又稱萬國碼。由Ken Thompson於1992年創建。現在已經標准化為RFC 3629。UTF-8用1到6個位元組編碼UNICODE字元。用在網頁上可以同一頁面顯示中文簡體繁體及其它語言（如英文，日文，韓文）。

在Java開發中，特別是web開發，亂碼是一種很常見而且很頭疼的問題，這常常是由於頁面端、服務端、資料庫等幾處所使用的字元不一致所致，故開發中，保持編碼一致，往往能減少由於亂碼而帶來的時間浪費，是一件非常重要的事情。

⑤ java url中文轉碼問題

你這是從Servlet中取參然後在界面顯示是吧，JSP這個你設置的沒：<%@page pageEncoding="utf-8" contentType="utf-8" %>
以及request,response的設置：
request.setCharacterEncoding("utf-8");
response.setContentType("text/html;charset=utf-8");

⑥ java文件讀取內容轉碼

讀取的文件流如果是read（讀取位元組流的時候，中文就會是亂碼）方法，所以現在全都是聽過readline方式進行的讀取。舉例：
可以通過BufferedReader 流的形式進行流緩存，之後通過readLine方法獲取到緩存的內容。
BufferedReader bre = null;
try {
String file = "D:/test/test.txt";
bre = new BufferedReader(new FileReader(file));//此時獲取到的bre就是整個文件的緩存流
while ((str = bre.readLine())!= null) // 判斷最後一行不存在，為空結束循環
{
System.out.println(str);//原樣輸出讀到的內容
}；
bre.close()，//關閉流，否則bre流會一直存在，直到程序運行結束。

除此之外，java文件讀取的時候有中文就很出現亂碼，通常獲取到的文件中通常都是「iso8859-1」格式，需要轉換為「UTF-8」格式。
如：String str = new String（str.getByte("iso8859-1"),"UTF-8"）;進行下強制轉換後在進行讀取即可。
備註：通常格式有GBK、UTf-8、iso8859-1、GB2312，如果上面的強制轉換不成功，依次進行這些格式的嘗試，肯定是可以解決問題的。

⑦ java中文亂碼，能說下string.getBytes()和new String()轉碼是，具體點。

1、Java中，【String.getBytes(String decode)】的方法，會根據指定的decode，編碼返回某字元串在該編碼下的byte數組表示，例如：

byte[] b_gbk = "中".getBytes("GBK");
byte[] b_utf8 = "中".getBytes("UTF-8");
byte[] b_iso88591 = "中".getBytes("ISO8859-1")

上面三行代碼表示：分別返回「中」這個漢字在GBK、UTF-8和ISO8859-1編碼下的byte數組表示，此時b_gbk的長度為2，b_utf8的長度為3，b_iso88591的長度為1。

2、而通過【new String(byte[], decode)】的方式來還原這個「中」字時，實際是使用decode指定的編碼來將byte[ ]解析成字元串，例如：

String s_gbk = new String(b_gbk,"GBK");
String s_utf8 = new String(b_utf8,"UTF-8");
String s_iso88591 = new String(b_iso88591,"ISO8859-1");

s_gbk和s_utf8都是「中」，而只有s_iso88591是一個不認識的字元，因為ISO8859-1編碼的編碼表中，根本就沒有包含漢字字元，當然也就無法通過"中".getBytes("ISO8859-1")。

因此，通過【String.getBytes(String decode)】方法來得到byte[ ]時，要確定decode的編碼表中確實存在String表示的碼值，這樣得到的byte[ ]數組才能正確被還原。

(7)java中文轉碼擴展閱讀

java中文編碼避免亂碼

1、為了讓中文字元適應某些特殊要求（如http header頭要求其內容必須為iso8859-1編碼），可能會通過將中文字元按照位元組方式來編碼的情況，比如：

String s_iso88591 = new String("中".getBytes("UTF-8"),"ISO8859-1")

2、上述例子中的s_iso8859-1字元串實際是三個在 ISO8859-1中的字元，在將這些字元傳遞到目的地後，目的地程序再通過相反的方式：

String s_utf8 = new String(s_iso88591.getBytes("ISO8859-1"),"UTF-8")

來得到正確的中文漢字。這樣就既保證了遵守協議規定、也支持中文。

3、String.getBytes(String decode)方法會根據指定的decode編碼返回某字元串在該編碼下的byte數組表示這里是encode ，not decode，從字元串到位元組數組是編碼的過程，從位元組數組到字元串（即 new String（byte[] , charsetname））才是解碼的過程。

⑧ java字元串編碼的問題，如何轉碼才能正確顯示中文

String str = new String("暗示大家".getBytes(),"UTF-8");
重新用utf-8編碼

或者用
URLDecoder.decode("xxxxxx", "UTF-8");重新用utf-8解碼

望採納，謝謝

⑨ Java中中文轉碼，為什麼中文數字轉不過來

中文數字「1」其實跟一般的中文字是一樣的。所以當文件的編碼格式轉換之後，還是沒法轉過來的。
如果你只是想改變文件的編碼格式，並且想讓文件裡面的內容不會出現亂碼的話，有個辦法。
1、先把文件的內容復制一份出來，到記事本裡面；
2、修改文件的編碼格式；
3、把到記事本的內容再回改了編碼格式之後的文件中；
4、保存文件。

閱讀全文

熱點內容

華為的雲存儲是免費的嗎發布：2025-03-06 11:58:50 瀏覽：407

c語言中關系運算符發布：2025-03-06 11:58:01 瀏覽：264

lsw埠配置錯誤怎麼更改發布：2025-03-06 11:57:16 瀏覽：284

建設銀行手機銀行密碼在哪裡修改發布：2025-03-06 11:55:14 瀏覽：356

氣瓶如何存儲發布：2025-03-06 11:51:28 瀏覽：554

愛奇藝會員怎麼改密碼發布：2025-03-06 11:33:44 瀏覽：61

firefox不緩存發布：2025-03-06 11:33:43 瀏覽：467

淘寶密碼如何破解發布：2025-03-06 11:32:56 瀏覽：594

sqlservereclipse 發布：2025-03-06 11:25:29 瀏覽：706

linux存放文件發布：2025-03-06 11:24:47 瀏覽：447

java中文轉碼

與java中文轉碼相關的資訊