javastring的编码

发布时间: 2022-10-04 10:49:41

❶ java怎么对string编码

参考如下代码：

package com.qiu.lin.he;

import java.io.UnsupportedEncodingException;

public class Ceshi {

public static void main(String[] args) {

String name = "张三";

byte[] b1 = null;

try {

b1 = name.getBytes("UTF-8");

} catch (UnsupportedEncodingException e) {

e.printStackTrace();

}

String name1 = "";

try {

name1 = new String(b1, "UTF-8");

} catch (UnsupportedEncodingException e) {

e.printStackTrace();

} // 编码解码相同，正常显示

System.out.println(name1);

String name2 = "";

try {

name2 = new String(b1, "GBK");

} catch (UnsupportedEncodingException e) {

e.printStackTrace();

} // 编码解码不同，乱码

System.out.println(name2);

}

运行结果为：

❷ java中的String的默认编码是什么

可以通过如下代码获得默认编码：

System.out.println(Charset.defaultCharset());

字符编码（英语：Character encoding）也称字集码，是把字符集中的字符编码为指定集合中某一对象（例如：比特模式、自然数序列、8位组或者电脉冲），以便文本在计算机中存储和通过通信网络的传递。常见的例子包括将拉丁字母表编码成摩斯电码和ASCII。其中，ASCII将字母、数字和其它符号编号，并用7比特的二进制来表示这个整数。通常会额外使用一个扩充的比特，以便于以1个字节的方式存储。
在计算机技术发展的早期，如ASCII（1963年）和EBCDIC（1964年）这样的字符集逐渐成为标准。但这些字符集的局限很快就变得明显，于是人们开发了许多方法来扩展它们。对于支持包括东亚CJK字符家族在内的写作系统的要求能支持更大量的字符，并且需要一种系统而不是临时的方法实现这些字符的编码。

❸ javastring编码

从ISO-8859-1编码转为GBK编码，因为所有的编码底层都是Unicode编码就是为了编码的统一
最后是GBK编码，默认看eclipse的配置，不该的情况是ISO-8859-1，最好改为UTF-8

❹ 请问java如何改变字符串的编码方式

byte[] b=string.getBytes("GB2312");//使用GB2312编码方式对字符串string进行编码
//这时要想将字节数组b的内容正确解码只能使用GB2312的编码方式进行解码，即
String str=new String(b,"GB2312");//这里若使用UTF-8编码方式来进行解码就会乱码
//将eclipse默认的编码方式改为UTF-8，只是用该编码方式对.java源文件进行编码保存
//这个对new String(string.getBytes("GB2312"),"UTF-8")没啥影响的
//因为从java源文件获取字符串string时，已经通过UTF-8编码方式进行解码了
//而string.getBytes("GB2312")是使用指定的编码方式对字符串string进行从新编码
//这两者之间没啥关系的

❺ java如何把string转为utf-8

java不同编码之间进行转换，都需要使用unicode作为中转。

String str = "任意字符串";

str = new String(str.getBytes("gbk"),"utf-8");

备注说明：

str.getBytes("UTF-8"); 意思是以UTF-8的编码取得字节

new String(XXX,"UTF-8"); 意思是以UTF-8的编码生成字符串

举例：

public static String getUTF8XMLString(String xml) {

// A StringBuffer Object

StringBuffer sb = new StringBuffer();

sb.append(xml);

String xmString = "";

String xmlUTF8="";

try {

xmString = new String(sb.toString().getBytes("UTF-8"));

xmlUTF8 = URLEncoder.encode(xmString, "UTF-8");

System.out.println("utf-8 编码：" + xmlUTF8) ;

} catch (UnsupportedEncodingException e) {

// TODO Auto-generated catch block

e.printStackTrace();

}

// return to String Formed

return xmlUTF8;

(5)javastring的编码扩展阅读:

UTF-8编码规则：

如果只有一个字节则其最高二进制位为0；如果是多字节，其第一个字节从最高位开始，连续的二进制位值为1的个数决定了其编码的字节数，其余各字节均以10开头。

实际表示ASCII字符的UNICODE字符，将会编码成1个字节，并且UTF-8表示与ASCII字符表示是一样的。所有其他的UNICODE字符转化成UTF-8将需要至少2个字节。每个字节由一个换码序列开始。第一个字节由唯一的换码序列，由n位连续的1加一位0组成，首字节连续的1的个数表示字符编码所需的字节数。

Unicode转换为UTF-8时，可以将Unicode二进制从低位往高位取出二进制数字，每次取6位，如上述的二进制就可以分别取出为如下示例所示的格式，前面按格式填补，不足8位用0填补。

❻ java里关于String的编码与解码

public
byte[]
getBytes(String
charsetName)
使用指定的字符集将此String编码为byte序列，结果存在一个byte数组中
public
String(byte[]
bytes,
String
charsetName)
通过使用指定的
charset
解码指定的
byte
数组，构造一个新的
String。
在网络传输中，信息都是以字节序列的方式传输的。所以，发送方的String要按照某种编码方式(如UTF-8,GBK)编码为字节序列，在网络中传输后，接收方取得这个字节序列，按照相同的编码方式将字节序列解码为String。
请看下面的代码片段：
String
name
=
"张三";
byte[]
b1
=
name.getBytes("UTF-8");
String
name1
=
new
String(b1,
"UTF-8");
//编码解码相同，正常显示
System.out.println(name1);
String
name2
=
new
String(b1,
"GBK");
//编码解码不同，乱码
System.out.println(name2);
byte[]
b2
=
name.getBytes("GBK");
String
name3
=
new
String(b2,
"GBK");
//编码解码相同，正常显示
System.out.println(name3);
String
name4
=
new
String(b2,
"UTF-8");
//编码解码不同，乱码
System.out.println(name4);
至于你的那个情况，要先用gbk编码，然后再用utf-8解码才能获得正常的字符串，我估计是因为
1.传输过来的字节码是用utf-8编码的,假设字节码为b。
2.你获得的那个字符串，假设为s，是用gbk对b进行解码获得的字符串，所以是乱码。
3.你使用gbk对s进行编码，用gbk解码之后再编码，于是获得了原来的b。
4.你使用utf-8解码，所以获得了正常的字符串。
简单的说：
b
->
(gbk解码)
->
乱码
->
[此处开始是你做的](gbk编码)
->
b
->
(utf-8解码)
->
正常字符串
研究完编码收获会不小的，对以后理解Java的输入输出(尤其是网络通信和文件读写)都很有帮助。

❼ java的String存储中文的时候存的是什么，是按照什么编码方式存储的

String在内存中是以UCS-2编码或者叫UTF-16的早期版本存储。

当写入文件可以用其他指定的编码，比如GB2312，GBK，BIG5等。

❽ 怎么知道 java字符串编码格式

这样的测试方法是不正确的。getBytes(charset)是解码，new String(byte[], charset)是编码。new String(str.getBytes(charset),charset)是解码再编码，无论charset是什么编码格式，返回的字符串内容原始str是一致，因此equals方法都是返回true，达不到测试字符串编码格式的目的。个人观点：正确的测试姿势应该是这样的：

Stringcharset="xxx";//假定编码格式
Stringstr="中文"；
booleanflag=str.equals(newString(str.getBytes(),charset));

flag为true则表明str的编码格式是假定的编码格式。其中说明str.getBytes()该方法就是按其自身编码格式去解码。其自身编码格式跟你的操作系统编码格式或你使用的IDE设置的文件的Text file encoding有关。

❾ java中使用 Integer.toBinaryString()得到的是什么编码

最终得到的111001110001011（10进制为29579）对应的是“王”字在unicode中的编号，即unicode中第29579个字符是“王”。具体存储时会占用几个字节，是由编码来决定的，gbk编码下“王”字占用2个字节，utf-8则为3个字节。

阅读全文

热点内容

安卓手机玩mc卡怎么办发布：2024-12-23 12:15:46 浏览：5

mt编译时出现错误信息发布：2024-12-23 12:15:45 浏览：107

双存储冗余发布：2024-12-23 12:09:16 浏览：664

解压缩太慢发布：2024-12-23 12:08:36 浏览：535

linux恢复误删文件发布：2024-12-23 11:59:36 浏览：493

平板电脑账号登录服务器错误发布：2024-12-23 11:41:07 浏览：99

金蝶kis专业版数据库表发布：2024-12-23 11:35:41 浏览：602

相册已经加密如何改密码发布：2024-12-23 11:32:20 浏览：277

批量下载链接脚本发布：2024-12-23 11:29:11 浏览：973

PHP画a梦发布：2024-12-23 11:28:01 浏览：199

javastring的编码

与javastring的编码相关的资讯