java转换unicode
1. java怎么把汉字转化成unicode编码
中文转换成Unicode编码和Unicode编码转换成中文
importjava.util.Properties;
publicclassTest{
publicstaticvoidmain(String[]args){
Strings="简介";
Stringtt=gbEncoding(s);//Stringtt1="你好";
System.out.println(decodeUnicode("\u7b80\u4ecb"));//System.out.println(decodeUnicode(tt1));
System.out.println(HTMLDecoder.decode("中国"));
Strings1="u7b80u4ecb";
System.out.println(s.indexOf("\"));
}
publicstaticStringgbEncoding(finalStringgbString){
char[]utfBytes=gbString.toCharArray();
StringunicodeBytes="";
for(intbyteIndex=0;byteIndex<utfBytes.length;byteIndex++){
StringhexB=Integer.toHexString(utfBytes[byteIndex]);
if(hexB.length()<=2){
hexB="00"+hexB;
}
unicodeBytes=unicodeBytes+"\u"+hexB;
}
System.out.println("unicodeBytesis:"+unicodeBytes);
returnunicodeBytes;}
(finalStringdataStr){
intstart=0;
intend=0;
finalStringBufferbuffer=newStringBuffer();
while(start>-1){
end=dataStr.indexOf("\u",start+2);
StringcharStr="";
if(end==-1){
charStr=dataStr.substring(start+2,dataStr.length());
}else{
charStr=dataStr.substring(start+2,end);
}
charletter=(char)Integer.parseInt(charStr,16);//16进制parse整形字符串。
buffer.append(newCharacter(letter).toString());
start=end;
}
returnbuffer.toString();
}}
}
}
}
2. java有关unicode与十进制数字的转换
1、unicode编码规则
unicode码对每一个字符用4位16进制数表示。具体规则是:将一个字符(char)的高8位与低8位分别取出,转化为16进制数,
如果转化的16进制数的长度不足2位,则在其后补0,然后将高隐空扮、低8位转成的16进灶灶制字符串拼接起来并在前面补上"\u" 即可。
2、转码程序
1)字符串转unicode
/**
* 将字符串转成unicode
* @param str 待转字符串
* @return unicode字符串
*/
public String convert(String str)
{
str = (str == null ? "" : str);
String tmp;
StringBuffer sb = new StringBuffer(1000);
char c;
int i, j;
sb.setLength(0);
for (i = 0; i < str.length(); i++)
{
c = str.charAt(i);
sb.append("\\u");
j = (c >>>8); //取出高8位
tmp = Integer.toHexString(j);
if (tmp.length() == 1)
sb.append("0");
sb.append(tmp);
j = (c & 0xFF); //取出低8位
tmp = Integer.toHexString(j);
if (tmp.length() == 1)
sb.append("0");
sb.append(tmp);
}
return (new String(sb));
}
2)unicode转成字符串,与上述过程反向操作即可
/**
* 将unicode 字符串
* @param str 待转字符串
* @return 普通字符串
*/
public String revert(String str)
{
str = (str == null ? "" : str);
if (str.indexOf("\\u") == -1)//如果不是unicode码则原样返回
return str;
StringBuffer sb = new StringBuffer(1000);
for (int i = 0; i < str.length() - 6;)
{
String strTemp = str.substring(i, i + 6);
String value = strTemp.substring(2);
int c = 0;
for (int j = 0; j <亏宽 value.length(); j++)
{
char tempChar = value.charAt(j);
int t = 0;
switch (tempChar)
{
case 'a':
t = 10;
break;
case 'b':
t = 11;
break;
case 'c':
t = 12;
break;
case 'd':
t = 13;
break;
case 'e':
t = 14;
break;
case 'f':
t = 15;
break;
default:
t = tempChar - 48;
break;
}
c += t * ((int) Math.pow(16, (value.length() - j - 1)));
}
sb.append((char) c);
i = i + 6;
}
return sb.toString();
}
3. 用eclipse写java时,怎么把中文字符转换成unicode
在ECLIPSE中安装Property插件,然后打开一个Property文件,右键该文件,选隐绝世择【Unicode表灶肢示】菜单,宏做弹出文件中以unicode方式显示该文件的全部内容
4. java中Unicode码的转换
private static String decode(char[] in) throws Exception {
int off = 0;
char c;
char[] out = new char[in.length];
int outLen = 0;
while (off < in.length) {
c = in[off++];
if (c == '\\') {
if (in.length > off) { // 是否有下一个字符
c = in[off++]; // 取出下一个字符
} else {
out[outLen++] = '\\'; // 末字符为'\',返回
break;
}
if (c == 'u') { // 如果是"\\u"
int value = 0;
if (in.length > off + 4) { // 判断"\\u"后边是否有四个字符
boolean isUnicode = true;
for (int i = 0; i < 4; i++) { // 遍历四个字符
c = in[off++];
switch (c) {
case '0':
case '1':
case '2':
case '3':
case '4':
case '5':
case '6':
case '7':
case '8':
case '9':
value = (value << 4) + c - '0';
break;
case 'a':
case 'b':
case 'c':
case 'd':
case 'e':
case 'f':
value = (value << 4) + 10 + c - 'a';
break;
case 'A':
case 'B':
case 'C':
case 'D':
case 'E':
case 'F':
value = (value << 4) + 10 + c - 'A';
break;
default:
isUnicode = false; // 判断是否为unicode码
}
}
if (isUnicode) { // 是unicode码转换为字符
out[outLen++] = (char) value;
} else { // 不是unicode码把"\\uXXXX"填入返回值
off = off - 4;
out[outLen++] = '\\';
out[outLen++] = 'u';
out[outLen++] = in[off++];
}
} else { // 不够四个字符则把"\\u"放入返回结果并继续
out[outLen++] = '\\';
out[outLen++] = 'u';
continue;
}
} else {
switch (c) { // 判断"\\"后边是否接特殊字符,回车,tab一类的
case 't':
c = '\t';
out[outLen++] = c;
break;
case 'r':
c = '\r';
out[outLen++] = c;
break;
case 'n':
c = '\n';
out[outLen++] = c;
break;
case 'f':
c = '\f';
out[outLen++] = c;
break;
default:
out[outLen++] = '\\';
out[outLen++] = c;
break;
}
}
} else {
out[outLen++] = (char) c;
}
}
return new String(out, 0, outLen);
}
5. Java如何将一段汉字变成unicode码
publicclassT{
publicstaticvoidmain(String[]args){
Strings="我爱你";
System.out.println(string2Unicode(s));
}
(Stringstring){
StringBufferunicode=newStringBuffer();
for(inti=0;i<string.length();i++){
//取出每一个字符
charc=string.charAt(i);
//转换为unicode
unicode.append("\u"+Integer.toHexString(c));
}
returnunicode.toString();
}
}
6. java怎么把字符串转换为UTF8的unicode码
String str="你好";
char[] ch=str.toCharArray();
String ss=null;
for (int i = 0; i <蚂和 ch.length; i++) {
ss="\闷世盯返启\u"+Integer.toHexString(ch[i]);
System.out.println(ss);
}
7. JAVA程序,从键盘输入汉字,并将汉子转换为相应的unicode编码,怎么写啊
上代码:
importjava.util.Scanner;
publicclassMain{
publicstaticvoidmain(String[]args){
Scannersc=newScanner(System.in);
System.out.println("请输入汉字:");
Stringinput=sc.nextLine();
塌漏if(input.length()==0){
System.out.println("输入错误");
return;
}
System.out.println("汉字转unicode结果:");
char[]chars=input.toCharArray();
for(inti=0;i<chars.length;i++){
Stringunicode=Integer.toHexString(chars[i]);
if(unicode.length()<=2){
团哪烂//不足四位前面加0补齐
缓激unicode="00"+unicode;
}
unicode="\u"+unicode;
System.out.println(chars[i]+":"+unicode);
}
}
}
8. Java如何将一段汉字变成unicode码 例如我随意输入几个字 让它输出Unicode 求代码
按照指定字符集读取乱旦文本(utf-8或者gbk)得到字符串,按照字符一个一个提取轮渣出来,转换成unicode字符哗桐扰集的字节数组,转成16进制输出即可。
9. JAVA中如何将文件转换成UNICODE加密字符串
直接将char 转换陵宏成int 得到的就尺蔽册是对应的Unicode码并宴了。。
再用16进制表示就可以了。
java.lang.Integer.toHexString(int i)
10. JAVA怎么把藏文字符Unicode
在 Java 中,可以使用 Unicode 编码来表示藏文字符。Unicode 是一种标准化的字扰闹销符编码标准,它为每个字符分配了一个唯一的数字编码,可以缓游用于在不同的计算机系统和编程语言弯拆中表示字符。
藏文字符的 Unicode 编码范围为 0F00 到 0FFF,可以使用 Java 中的字符类型char来表示。具体方法如下:
使用 Unicode 转义序列表示藏文字符。Unicode 转义序列是以u开头,后跟四个十六进制数字的形式,表示一个 Unicode 字符。
- char c = 'u0F56';
直接使用藏文字符。
- char c = 'བ';
例如,要表示藏文字符 "བ",可以使用u0F56来表示:
在 Java 中,可以直接使用藏文字符,只要确保源代码文件的编码格式为 UTF-8,并在编译时指定编码格式为 UTF-8。例如,在 Eclipse IDE 中,可以在项目的编译选项中添加-encoding UTF-8参数来指定编码格式为 UTF-8。
以上是在 Java 中表示藏文字符的两种方法,根据具体的需求和编码环境选择适合的方法即可。