pythonhtml转txt文件
㈠ python HTML处理
[<tdstyle="text-align:center">2014-12-31</td>,<tdstyle="text-align:center">6.16</td>,<tdstyle="text-align:center"><fontstyle="color:red">隆眉</font>1.76</td>]
[<tdstyle="text-align:center">2013-12-31</td>,<tdstyle="text-align:center">11.47</td>,<tdstyle="text-align:center"><fontstyle="color:green">隆媒</font>1.72</td>]
[<tdstyle="text-align:center">2012-12-31</td>,<tdstyle="text-align:center">-5.5</td>,<tdstyle="text-align:center"><fontstyle="color:green">隆媒</font>4.31</td>]
[<tdstyle="text-align:center">2011-12-31</td>,<tdstyle="text-align:center">14.83</td>,<tdstyle="text-align:center"><fontstyle="color:green">隆媒</font>0.53</td>]
[<tdstyle="text-align:center">2010-12-31</td>,<tdstyle="text-align:center">1.8</td>,<tdstyle="text-align:center"><fontstyle="color:green">隆媒</font>0.63</td>]
[<tdstyle="text-align:center">2009-12-31</td>,<tdstyle="text-align:center">21.69</td>,<tdstyle="text-align:center"><fontstyle="color:red">隆眉</font>5.61</td>]
[<tdstyle="text-align:center">2008-12-31</td>,<tdstyle="text-align:center">0.19</td>,<tdstyle="text-align:center"><fontstyle="color:green">隆媒</font>0.03</td>]
[<tdstyle="text-align:center">2007-12-31</td>,<tdstyle="text-align:center">2.89</td>,<tdstyle="text-align:center"><fontstyle="color:red">隆眉</font>0.77</td>]
[<tdstyle="text-align:center">2006-12-31</td>,<tdstyle="text-align:center">7.37</td>,<tdstyle="text-align:center"><fontstyle="color:red">隆眉</font>2.71</td>]
[<tdstyle="text-align:center">2005-12-31</td>,<tdstyle="text-align:center">3.99</td>,<tdstyle="text-align:center"><fontstyle="color:red">隆眉</font>28.66</td>]
[<tdstyle="text-align:center">2004-12-31</td>,<tdstyle="text-align:center">-132.62</td>,<tdstyle="text-align:center"><fontstyle="color:green">隆媒</font>78.84</td>]
[<tdstyle="text-align:center">2003-12-31</td>,<tdstyle="text-align:center">23.79</td>,<tdstyle="text-align:center">听</td>]
[<tdstyle="text-align:center">2002-12-31</td>,<tdstyle="text-align:center">-759.2139</td>,<tdstyle="text-align:center"><fontstyle="color:green">隆媒</font>745.9739</td>]
[<tdstyle="text-align:center">2001-12-31</td>,<tdstyle="text-align:center">-5.47</td>,<tdstyle="text-align:center"><fontstyle="color:green">隆媒</font>6.852</td>]
[<tdstyle="text-align:center">2000-12-31</td>,<tdstyle="text-align:center">6.82</td>,<tdstyle="text-align:center"><fontstyle="color:red">隆眉</font>3.95</td>]
[<tdstyle="text-align:center">1999-12-31</td>,<tdstyle="text-align:center">10.48</td>,<tdstyle="text-align:center"><fontstyle="color:red">隆眉</font>6.87</td>]
[<tdstyle="text-align:center">1998-12-31</td>,<tdstyle="text-align:center">12.28</td>,<tdstyle="text-align:center"><fontstyle="color:red">隆眉</font>7.21</td>]
[<tdstyle="text-align:center">1997-12-31</td>,<tdstyle="text-align:center">54</td>,<tdstyle="text-align:center"><fontstyle="color:green">隆媒</font>18</td>]
[<tdstyle="text-align:center">1996-12-31</td>,<tdstyle="text-align:center">72</td>,<tdstyle="text-align:center"><fontstyle="color:red">隆眉</font>7</td>]
[<tdstyle="text-align:center">1995-12-31</td>,<tdstyle="text-align:center">65</td>,<tdstyle="text-align:center">听</td>]
不止2004年的数据
我修改了下你的代码用的requests的库
importos
importsys
importtime
importrequests
importbs4
frompprintimportpprint
roe=open('ROE.txt','w')
req="http://vip.stock.finance.sina.com.cn/corp/view/vFD_FinancialGuideLineHistory.php?stockid=600159&typecode=financialratios59"
soup=bs4.BeautifulSoup(requests.get(req,timeout=30).text)
buffer=soup.find(id='Table1')
rows=buffer.find_all('tr')
forrowinrows:
cols=row.find_all('td')
text=str(cols)
if"-12-31"intext:
roe.write(text+' ')
time.sleep(2)
roe.close()
㈡ 使用python遍历文件夹将文件夹中所有的txt文本转为html连接形式。
importos
defgetalltxtfilename(path):
txtfilenames=[]
fordirpath,dirnames,filenamesinos.walk(path):
filenames=filter(lambdafilename:filename[-4:]=='.txt',filenames)
filenames=map(lambdafilename:os.path.join(dirpath,filename),filenames)
txtfilenames.extend(filenames)
returntxtfilenames
deftxttohtmllink(path):
filenames=getalltxtfilename(path)
htmllink=[]
forfilenameinfilenames:
ifos.path.isfile(filename):
htmllinktext=''
myfile=open(filename)
firstline=myfile.readline()
whilefirstlineandlen(firstline)<2:
firstline=myfile.readline()
ifnotfirstline:
firstline=''*2
else:
firstline=firstline.strip(' ')
htmllinktext+=firstline[0]+'<ahref="'+
filename+'">'+
firstline[1:]+'</a><br>'
htmllink.append(htmllinktext)
myfile.close()
returnhtmllink
path=r"文件夹路径"#将此处替换为实际文件夹的路径
htmllinks=txttohtmllink(path)
forhtmllinkinhtmllinks:
printhtmllink
在html标记前加上一个字符,这就不是合法的html文本形式,还是按照要求做了,如果输入到html文件肯定会出错
㈢ 使用Python获取网页上出现的所以IP地址,并保存到TXT文档中,如何做到啊 。。。
假设文本放在在一个文本字符串里html, 如果你没有获得只有URL可以这样
import urllib2, re
html=urllib2.urlibopen(url).read()
ips=re.findall("(?isu)\d+\.\d+\.\d+\.\d+",html)
if ips: open("ips.txt","wb").write("\r\n".join(ips))
㈣ python怎么把字符串保存到txt文件,再读取txt文件转换为字符串
## 写入
f = open("a.txt", "wb")
f.write("hello,world")
f.close()
## 读取
ff = open("a.txt", "rb")
ff.readlines()
ff,close()
㈤ Python如何运行HTML程序
肯定是可以,写一个浏览器都没有问题。
不过正常情况不会去做,费神费力,通常嵌入浏览器插件就可以,比如qt。
㈥ python怎么输入代码令读写txt文件,输出的格式与原txt文件不一样
第一题,直接file.write即可
第二题,读进来str,然后eval()可以直接变成python列表,
遍历,然后用format输出
㈦ 如何python提取txt文档里面全部的中文和中文符号,并且保存为新的txt文档
用beautifulsoup处理啊,去除英文和符号就是中文啦
importre
zhongwen=re.sub(r'[w<>/,=:"']','',text')
㈧ python提取数据转入txt
如果你的mvp.pcapng是文本文件,可以用记本事打开,并另存,另存的时候编码选为UTF-8,注意不要是ANSI,这样就能在代码中导入了。
㈨ python 输出文件到txt
name=['a1','a2','a3']
seq=['seq11111','seqs22222','seq33333']
f=open("F:/1.txt","w+")
f.write("name seq ")
foriinrange(0,len(name)):
f.write(name[i]+" "+seq[i]+" ")
f.close()
㈩ python讲TXT批处理成HTML文件
这个的关键是你要理解正则表达式((r'\*(.+?)\*',r'<em>\1</em>',block))