python讀取中文文件
⑴ python讀取csv文件時,數據內容含有中文,讀取出錯,怎麼辦
估計是亂碼造成,需要在讀取的py文件中指定編碼格式:
在文件開頭,設置成gbk格式import
os,sys,re,csv
reload(sys)
sys.setdefaultencoding('gbk')
⑵ python讀寫有中文的文件時,是否需要設置編碼格式
需要:
with open("路徑","模式",encoding="utf8") as f:
如果不確定編碼格式,後面讀取可能會出問題
⑶ python 讀取的中文怎麼使用
file = open('filename.txt','r')
text = file.read() #讀取所有文字
text = file.readline() #讀取一行文字
text = file.readlinse() #把每一行變成list的一個元素
如果需要裡面中文的話,用正則匹配
⑷ python如何打開中文文件 文件名是中文
確保編碼設置正確,路徑正確(包括轉義,空格),並且有許可權,就行了,其他的都一樣。
⑸ python怎麼讀取文本中的漢字
x="你好"
print("你好")
⑹ python 中怎麼讀取txt文件中的中文文字
代碼:
# -*- coding: utf-8 -*-
f = open('luciatest1.txt', encoding='gb18030')
filecontent = f.read()
print(filecontent)
運行效果:
⑺ python怎樣讀取文本文件里的中文
#在Windows 環境下
import sys
reload(sys)
sys.setdefaultencoding("utf-8")
import re
fin = open('in.txt', 'r') #以讀的方式打開輸入文件
for eachLine in fin: #按行讀入文件內容
line = eachLine.strip().decode('gbk', 'utf-8') #處理前進行相關的處理,包括轉換成Unicode等
print line #列印原始字元
p2 = re.compile(ur'[^\u4e00-\u9fa5]') #中文的編碼范圍是:\u4e00到\u9fa5
zh = "".join(p2.split(line)).strip()
#zh = ",".join(zh.split())
print zh ##列印中文字元
⑻ python在win下怎麼讀取中文文件
file = open('filename.txt','r') text = file.read() #讀取所有文字 text = file.readline() #讀取一行文字 text = file.readlinse() #把每一行變成list的一個元素 如果需要裡面中文的話,用正則匹配
⑼ python如何讀取中文文件內容
open(錦囊一,'r',encoding="utf-8")
⑽ python中用pandas.read_csv讀取含有中文的文件
python2下:
1234
# -*- coding: utf-8 -*- import pandas as pdmydata = pd.read_csv(u"例子.csv") #前面加u,第一行的編碼必須utf-8
原本以為這一點python3和python2是一樣的,其實不一樣!
python3下:
1234567
# -*- coding: utf-8 -*- import pandas as pd#以下三種等價(也有可能不等),如果你一種不行換另一種吧mydata = pd.read_csv(u"例子.csv",encoding = "gbk")mydata = pd.read_csv(u"例子.csv",encoding = "gb2312") mydata = pd.read_csv(u"例子.csv",encoding = "gb18030")