java中文unicode
❶ java如何将一段汉字变成unicode码
publicclassT{
publicstaticvoidmain(String[]args){
Strings="我爱你";
System.out.println(string2Unicode(s));
}
(Stringstring){
StringBufferunicode=newStringBuffer();
for(inti=0;i<string.length();i++){
//取出每一个字符
charc=string.charAt(i);
//转换为unicode
unicode.append("\u"+Integer.toHexString(c));
}
returnunicode.toString();
}
}
❷ java 中常用汉字 的unicode 码范围是多少到多少
常用汉字 的unicode 码范围是:u4e00-u9fa5,下面一个例子是把中英文文档中的汉字提取出来的简单例子:
publicclassDrawEnglish
{
privatestaticStringdraw(Stringcontent)
{
StringBufferenglish=newStringBuffer();
Stringregex="[u4e00-u9fa5。,?”“《》:!——-、]";
Patternpattern=Pattern.compile(regex);
Matchermatcher=pattern.matcher(content);
while(matcher.find())
{
Stringtemp=matcher.group();
english.append(temp);
}
returnenglish.toString();
}
publicstaticvoiddrawEnglish(Stringpath)
{
FileInputStreamfr;
BufferedReaderbr;
FileWriterfw;
BufferedWriterbw=null;
try
{
fr=newFileInputStream(path);
br=newBufferedReader(newInputStreamReader(fr,"gb2312"));
fw=newFileWriter("new1.txt");
bw=newBufferedWriter(fw);
Stringstr=null;
StringBuffersb=newStringBuffer();
while((str=br.readLine())!=null)
{
sb.append(str+" ");
}
Stringtemp=draw(sb.toString());
bw.write(temp);
}catch(FileNotFoundExceptione)
{
e.printStackTrace();
}catch(IOExceptione)
{
e.printStackTrace();
}
finally
{
try
{
if(bw!=null)bw.close();
}catch(IOExceptione)
{
e.printStackTrace();
}
}
}
publicstaticvoidmain(String[]args)
{
drawEnglish("draw1.txt");
}
}
❸ 编写JAVA程序输出中文字的unicode编码
我写的,你试试,你可以把它改写成循环的,可以一直把字符的Unicode输出,完善后发给我哈:
import java.io.*;
public class FindUnicode {
public static void main(String[] args) throws IOException{
InputStreamReader read = new InputStreamReader (System.in);
int ch = read.read();
System.out.print("\\u"+Integer.toHexString(ch));
read.close();
}
}
❹ 用java如何把unicode码转成汉字
java中将unicode码转换成汉字的方式是直接使用string类型,打印即可:
Stringascii="u4f01u4e1a";//这两个unicode码就是企业的
System.out.println(ascii);//打印出来
运行结果:
企业
Unicode只有一个字符集,中、日、韩的三种文字占用了Unicode中0x3000到0x9FFF的部分 Unicode目前普遍采用的是UCS-2,它用两个字节来编码一个字符, 比如汉字"经"的编码是0x7ECF,注意字符编码一般用十六进制来 表示,为了与十进制区分,十六进制以0x开头,0x7ECF转换成十进制 就是32463,UCS-2用两个字节来编码字符,两个字节就是16位二进制, 2的16次方等于65536,所以UCS-2最多能编码65536个字符。
❺ java中如何取得中文如“中国”在unicode编码中的表示串
public class Demo
{
public static void main(String[] args)
{
String str="例子";
//数组bm保存的就是"例子"的Unicode代码点(10进制)
int[] bm=new int[str.length()];
for(int i=0;i<str.length();i++)
{
bm[i]=str.codePointAt(i);
System.out.print(""+bm[i]+" ");
}
}
}
❻ java中Unicode到底是什么啊
UNICODE和ASCII是一个意思 只不过他们在对字符进行表达的时候 长度不同 ASCII是美国编码 UNICODE是统一编码, UNICODE其实就是ASCII的扩充,因为互谅网的发展ASCII无法满足(因为ASCII是单字节的,容量有限)全世界的各种字符,因此要更大的更统一的编码,于是出现了 UNICODE 。说白了 就是的设计缺陷。等以后发现外星人了,估计还要宇宙统一代码 呵呵
❼ java中如何在中文字符和unicode编码之间进行转换
可以这样来重构字符串new String(“XXX".getByte(),”UTF-8“);后面加上编码方式