python中文長度
1. python3 字元串多少個漢字
在python中一個漢字算一個字元,一個英文字母算一個字元。如:
##coding:utf-8
s='我們的'
k=len(s)
print(k)
輸出結果是3。
===================================
所以,可以採取排除法,凡返回字元的ascII碼在大於127的作為漢字統計。
##coding:utf-8
s='我們的88工作和生活168'
k=len(s)
print(k)
n=0
forcins:
iford(c)>127:
n+=1
print(n)
2. python怎麼獲取中文所佔位元組數,比如len("我")的結果是1,但我想得到的結果是2,該怎麼做
python的字元是存儲的unicode,你把len返回直接乘以2就行了
3. python一個漢字的長度是多少
這要看使用的哪種編碼方式,utf-8的話是用了3個位元組,GBK的話是用了兩個
>>>'漢'.encode('utf-8')
b'xe6xb1x89'
>>>'漢'.encode('GBK')
b'xbaxba'
4. python判斷是否含有中文字元及長度
1
2
3
4
#coding=utf-8
test_str = u'提問123'
print len(test_str) # 輸出5
或者
1
2
3
4
5
#coding=utf-8
test_str = '提問123'
test_str_unicode = test_str.decode('utf-8')
print len(test_str_unicode) # 輸出5
求這種長度可以轉化成求解碼(unicode)的長度;報UnicodeDecodeError,應該是直接用了test_str.encode('utf-8'),這是編碼。
5. python中文字元串怎麼定位啊,比如『我愛中國』,,那麼如果『我愛中國』[2:3]不是「中國」兩個字啊
中文字元在不同編碼規則里所佔用的長度是不同的,這個你可以去查詢相應的編碼規則,具體到python中,可以從以下的小例子中看出:
也就是說如果你使用的unicode編碼在python中的長度為1,gbk編碼在python中的長度為2。對於utf-8編碼來書,字元長度是可變的(這個可以從上圖的str4和str5看出),不同的字元所佔用的位元組數是不同的,例如數字和字母佔用1個位元組,漢字、日文、韓文等佔用2個位元組或以上,長度不定。
所以還需要具體情況具體分析,
具體到你的問題,根據python的切片規則,[2:3]僅僅取了第三個個位元組,並不包括第三個,想要取兩個的話可以用[2:4]。想要解決你的問題按照不同的編碼對應即可
6. [編程python]python中字元串的長度是如何計算的
一對引號之間的任何東西都算一個字元,包括字母、數字、符號、漢字、空白符等。
7. python字元串長度len
我是這方面的老師,這個問題其實挺簡單的
新建一個 使用len()函數得到字元的總長度.py
中文編碼聲明注釋:# coding=gbk
len() 方法的作用:獲取字元串的長度
輸入代碼:str1 = "海翔飛"
使用 len() 函數獲取 str1 的字元串長度
運行腳本,輸出 str1 的字元串長度
ok,到這就完工了,祝你學習愉快,記得採納