python文本
Ⅰ 如何用python将非文本文件以文本形式打开
open(file_path, mode, encoding, ...)
open函数默认就是文本模式(t一般都省略),除非你指定b模式,所以open(xxx, "r")就可以。
Ⅱ Python 截取文本内容
你要的内容说得不清楚:
importjsonasjs
file="test.json"#此文件中存放的是下面str_js中一样的内容
str_js='{"msg":"你电脑打字一分钟字速多少","type":"text"}'#字符串
mydict=js.loads(str_js)
print(mydict['msg'])#你电脑打字一分钟字速多少
withopen(file)asf:
mydict=js.load(f)
print(mydict['msg'])
不知道你的原始数据内容来自哪里,是个字典还是字符串?
Ⅲ 如何用python去掉文本中的\
s=r'123456'#r表示原生字符,即字符串中的不是用来转义,而是其本身
print(s.replace('\',''))
运行结果:
123456
Ⅳ python 处理文本,格式化文本~
#coding=utf-8
records=[]
record={}
withopen("data.txt")asf:
whileTrue:
line=f.readline()
ifnotline:
iflen(record)!=0:records.append(record)
break
field=line[line.find(":")+1:].strip()
ifline.startswith("ScopeId"):
iflen(record)!=0:records.append(record)
record={}
record["ScopeId"]=field
elifline.startswith("Name"):
record["Name"]=field
elifline.startswith("Free"):
record["Free"]=field
elifline.startswith("InUse"):
record["InUse"]=field
elifline.startswith("PercentageInUse"):
record["PercentageInUse"]=field
#设置缺省项
forrinrecords:
r.setdefault("InUse",0)
r.setdefault("PercentageInUse",0)
r.setdefault("Name","")
r.setdefault("Free",0)
printrecords
Ⅳ Python字符串是什么,如何使用
字符串的表示
字符串可以被成对的单引号(single quote)或双引号(double quotes)包围起来,这两者的作用是一样的:
更多关于Python的基础性知识可以看下这个网页的视频教程,Python常见的数据类型及使用方法掌握,希望我的回答能帮到你。
Ⅵ python 文本查找
这个很简单哈,我用java写过类似的,python下没写过,但思路都是一样的,我说一下思路,供你参考一下:
【笨方法】”字符串截取“
基本字符串1=”abc123“
基本字符串2=”345aaa“
例如:目标字符串为:Today
is
a
good
day
aaa123目标字符串345aaa
那么:
获得基本字符串1的长度:len1=len(基本字符串1)
获得基本字符串2的长度:len2=len(基本字符串2)
---------------------------------------------------------------------
以len1长度开始截取目标字符串,以上面的例子为例,截取出来的应该为:
Today_
oday_i
day_is
ay_is_
y_is_a
等...........................
..............
当然这些都是一个循环就可以搞定,然后在这个循环里,对每次接触的字符串进行比对,如果找到与目标字符串形同的,则记下”索引“
开始进行下一步处理:截取本句剩下的部分,找到”基本字符串2“,然后记下其开始”索引“,那么两个”索引“之间的东东就是你想要的那个”目标字符串“,之后你想用它干什么都行...........
【超简单的方法】
会”正则表达式“吗?会的话,直接用正则吧,几句就出来了..........
Ⅶ python 文本内容提取
#!/usr/bin/python3
#-*-coding:utf-8-*-
defparse(text):
result=[]
importre
r1=re.compile(r's*(/[^s]+)s+FaceTrackings+{([^}]*)}s+(([^)]*))')
r2=re.compile(r's*FD_Faces+(([^)]*))')
pos=0
whileTrue:
m=r1.match(text[pos:])
ifnotm:
break
data={}
data['source']=m.group(1)
keys=m.group(2).split(',')
values=m.group(3).split(',')
attrs=dict(map(lambdax,y:[x,y],keys,values))
data.update(attrs)
pos+=m.end()
face=[]
forxinrange(int(data['FaceNumber'])):
m=r2.match(text[pos:])
ifnotm:
break
face.append(m.group(1).split(','))
pos+=m.end()
data['FD_Face']=face
result.append(data)
returnresult
defmain(input_file,output_file):
f=open(input_file,'r')
text=f.read()
f.close()
result=parse(text)
buff=[]
fordatainresult:
buff.append('miFileIndex:{miFileIndex}'.format(**data))
buff.append('source:{source}'.format(**data))
buff.append('FaceNumber:{FaceNumber}'.format(**data))
i=0
forfaceindata['FD_Face']:
i+=1
buff.append('Face{0}:({1})'.format(i,','.join(face)))
buff.append('')
f=open(output_file,'w')
f.write(" ".join(buff))
f.flush()
f.close()
if__name__=='__main__':
importsys
iflen(sys.argv)==3:
main(sys.argv[1],sys.argv[2])
Ⅷ python文本处理
下面的代码要求 a.txt 和 b.txt 必须是 utf-8 编码(这样才能正确处理中文),如果你的文件全是 ascii的英文的,那自己把所有utf-8相关的语句删掉即可。另外我的代码直接打印出来了结果,你可以用重定向或者把 print 那里改成写入 c.txt 。 另,用的是 python2,如果你是 python3,改一下 print 语句即可
没问题了花,别忘了把你原来的那个问题关掉 :)
#!/usr/bin/python2
#_*_coding:utf-8_*_
defmatch_sentence(wlist,wset):
stack=[]
start=0
end=0
whileTrue:
end+=1
w=u''.join(wlist[start:end])
ifwinwset:
stack.append(tuple([start,end]))
ifend==len(wlist):
#fullmatch
yield[''.join(wlist[x:y])forx,yinstack]
stack.pop()
else:
start=end
continue
ifend==len(wlist):
iflen(stack)>0:
start,end=stack.pop()
else:
return
wordset=set()
#processb.txttocollectwords
forlineinopen("b.txt","r"):
w=line.strip().decode("utf-8")
iflen(w)>0:
wordset.add(w)
#processa.txt
forlineinopen("a.txt","r"):
line=line.strip()
iflen(line)==0:
continue
line=line.decode("utf-8")
words=line.split('')
forxinmatch_sentence(words,wordset):
x=['[%s]'%(w)forwinx]
print''.join(x)
Ⅸ python文本处理问题
请把文件放到网络网盘,便于大家测试。
Ⅹ Python:怎样将txt文件读取到一个字符串里
1、首先在vscode里面添加了Python文件和用于读取的文本文件。