python字元串查找中文
發布時間: 2024-09-22 20:50:12
『壹』 python如何在中文字元串中定位,並截取其後面的內容詳見例子,拜託
定位某個字元串,可以使用字元串函數find(sub[,start[,end]]),返回匹配sub字元串的第一個對象的起始索引位置,或使用re模塊下的re.search(pattern, string)方法,查找第一個匹配的位置,並返回一個匹配對象(match object,裡麵包含匹配的起始和終止位置信息等)。至於截取的操作,我其實不是很明白,所以給出的回答,僅供參考:
importre
content="我有一個小毛驢可我從來也不騎有一天我騎著它上街區趕集
我想吃有一頭大象可我從來也不騎有一天我騎著它上街區趕集
我買了一頭小野豬可我從來也不騎有一天我騎著它上街區趕集"
deflocation_and_capture(search_str,full_content):
location=re.search(search_str,full_content)#返回一個matchobject
span=location.span()#返回匹配對象起始位置索引和結束位置索引組成的元組,即(start,end)
start,end=span
capture_content=content[start+2:end]
print("位置:",'(',start,end,')',"截取的內容:",capture_content)
donkey=location_and_capture('一個小毛驢',content)
elepphant=location_and_capture('一頭大象',content)
boar=location_and_capture('一頭小野豬',content)
'''
輸出結果:
位置:(27)截取的內容:小毛驢
位置:(4246)截取的內容:大象
位置:(8085)截取的內容:小野豬
[Finishedin0.1s]
'''
『貳』 Python用正則表達式匹配含有中文的字元串,匹配不到
代碼如下:
#coding=utf-8
importre
s=u'<li><aclass="nav-first"href="/">首頁</a></li>'
r=re.compile(u'<li><asclass="[^"]*"shref="[^"]">(.*?)(?=</a></li>)')
ss=r.findall(s)
forstrinss:
printstr
運行結果:
『叄』 python中如何正確列印元素為中文字元串的list
用個for循環吧
for z in i:
print z
這樣就可以了
如果是字典的話
d = {'中文':'中國'}:
print '%s : %s' % (k,v) for k,v in d.items()
就可以很輕松的實現列印了
『肆』 python判斷字元串是否有中文符號
defis_chinese(s):
count=0
foriins:
if(i>=u'u4e00')and(i<=u'u9fa5'):
returnTrue
break
else:
count+=1
ifcount==len(s):
returnFalse
然後檢查有沒有中文就輸is_chinese('內容'),記住括弧里的字元串要加引號
熱點內容