pythonhtml
① python怎麼解析html文檔
Python提供了一個HTMLParser模塊,可以非常簡單的解析HTML
首先考慮如何從如下的HTML中提取信息
<!--basic.html>
<HTML>
<HEAD>
<TITLE>DocTitle&Intro</TITLE>
</HEAD>
<BODY>
Thisismytext.
</BODY>
</HTML>
首先定義一個TitleParser類,是標准HTMLParser類的子孫
HTMLParser的feed()方法會調用handle_starttag(),handle_data(),handle_endtag()方法
#!/usr/bin/envpython
#coding=utf-8importsys
classTitleParser(HTMLParser):
def__init__(self):
self.title=''
self.readingtitle=0
HTMLParser.__init__(self)
defhandle_starttag(self,tag,attrs):
iftag=='title':
self.readingtitle=1
defhandle_data(self,data):
ifself.readingtitle:
self.title+=data
defhandle_endtag(self,tag):
iftag=='title':
self.readingtitle=0
defhandle_entityref(self,name):
ifentitydefs.has_key(name):
self.handle_data(entitydefs[name])
else:
self.handle_data('&'+name+';')
defgettitle(self):
returnself.title
fd=open(sys.argv[1])
tp=TitleParser()
tp.feed(fd.read())
print"Titleis:",tp.gettitle()
② python和html哪個好
Python和html的區別:
html是一種標記語言,是前端必須懂的一種語言之一。
而Python是作為後端語言的,所以你想學習前端只有一種選擇,學html。
對於初學者來說,html和Python上手比較快。
Python目前廣泛應用於人工智慧,是AI的第一開發語言,有很多網站也是用Python寫的。
單單只會html是不能勝任前端這個職位的,還需要學習css和JavaScript才能勝任。
所以學習前端的話html好,學習後端的話Python好。
更多Python知識,請關註:Python自學網!!
③ 如何將python代碼嵌入html代碼中
用Gestalt能夠改變現狀的Javascript庫與Silverlight結合後,它可以讓開發者直接在HTML中嵌入Python,在查看站點源代碼時,會看到類似這樣的代碼:
<scriptlanguage="python">
將這句話包含在頁面頂部,這就是在著手寫Python前所要做的所有準備。它會將內聯的Python代碼傳給Silverlight運行時,該運行時支持Dynamic Language Runtime。
④ python是否可以寫網站使用python寫的網站html在哪裡
當然,html一般以模板的形式存放在不同的框架目錄中。
⑤ 如何用Python做HTML的頁面
<html>
<body>
<form>
可獲取碼列表:
<select name="liscode">
<option value="01">123456</option>
<option value="02">123457</option>
<option value="03">123458</option>
<option value="04">123459</option>
<option value="05">123460</option>
<option value="06">123461</option>
</select>
<input type="submit" value="確認獲取"/>
</form>
</body>
</html>
其中所有liscode是從一個txt文檔上提取的,當用戶點擊獲取一個的時候,該項即被刪除。
如何用python實現呢?
做一個py腳本或exe給用戶實現的話大概像下面這樣:
Python code
infile = open('codelist.txt','r') codelist = infile.readlines() used_code = codelist[0] #remove用掉的code(刪除行) codelist.remove(codelist[0]) infile.close() #重寫文件(我不知道是否有能直接刪除一行的文件操作方法) outfile = open('codelist.txt','w') for code in codelist: outfile.write(code + '\n') outfile.close() print used_code
⑥ 怎樣用Python寫一個Html的簡單網頁
1、打開sublime text 3,新建一個PY文件。
⑦ 怎樣用python腳本生成一個html格式的測試報告
比如很簡單的,可以這樣:
# -*- coding:utf-8 -*-
import os,sys
html = open('index.html', 'w')
html.write("""
<html>
<head>
<title>Test</title>
<style>img{float:left;margin:5px;}</style>
</head>
<body>
""")
files = os.listdir('.')
# 首先處理文本
for f in files:
if f.lower().endswith('.txt'):
fp = open(f)
content = fp.read()
fp.close()
html.write("<p>%s</p>" % content)
# 然後處理圖片
for f in files:
if f.lower().endswith('.jpg') or f.lower().endswith('.png'):
html.write("<img src='%s' />" % f)
html.write('</body></html>')
html.close()
把這個python代碼放在有圖片和txt文本的目錄里,運行就可以了。如果不是jpg,修改增加png,gif就行了。
⑧ python HTML處理
[<tdstyle="text-align:center">2014-12-31</td>,<tdstyle="text-align:center">6.16</td>,<tdstyle="text-align:center"><fontstyle="color:red">隆眉</font>1.76</td>]
[<tdstyle="text-align:center">2013-12-31</td>,<tdstyle="text-align:center">11.47</td>,<tdstyle="text-align:center"><fontstyle="color:green">隆媒</font>1.72</td>]
[<tdstyle="text-align:center">2012-12-31</td>,<tdstyle="text-align:center">-5.5</td>,<tdstyle="text-align:center"><fontstyle="color:green">隆媒</font>4.31</td>]
[<tdstyle="text-align:center">2011-12-31</td>,<tdstyle="text-align:center">14.83</td>,<tdstyle="text-align:center"><fontstyle="color:green">隆媒</font>0.53</td>]
[<tdstyle="text-align:center">2010-12-31</td>,<tdstyle="text-align:center">1.8</td>,<tdstyle="text-align:center"><fontstyle="color:green">隆媒</font>0.63</td>]
[<tdstyle="text-align:center">2009-12-31</td>,<tdstyle="text-align:center">21.69</td>,<tdstyle="text-align:center"><fontstyle="color:red">隆眉</font>5.61</td>]
[<tdstyle="text-align:center">2008-12-31</td>,<tdstyle="text-align:center">0.19</td>,<tdstyle="text-align:center"><fontstyle="color:green">隆媒</font>0.03</td>]
[<tdstyle="text-align:center">2007-12-31</td>,<tdstyle="text-align:center">2.89</td>,<tdstyle="text-align:center"><fontstyle="color:red">隆眉</font>0.77</td>]
[<tdstyle="text-align:center">2006-12-31</td>,<tdstyle="text-align:center">7.37</td>,<tdstyle="text-align:center"><fontstyle="color:red">隆眉</font>2.71</td>]
[<tdstyle="text-align:center">2005-12-31</td>,<tdstyle="text-align:center">3.99</td>,<tdstyle="text-align:center"><fontstyle="color:red">隆眉</font>28.66</td>]
[<tdstyle="text-align:center">2004-12-31</td>,<tdstyle="text-align:center">-132.62</td>,<tdstyle="text-align:center"><fontstyle="color:green">隆媒</font>78.84</td>]
[<tdstyle="text-align:center">2003-12-31</td>,<tdstyle="text-align:center">23.79</td>,<tdstyle="text-align:center">聽</td>]
[<tdstyle="text-align:center">2002-12-31</td>,<tdstyle="text-align:center">-759.2139</td>,<tdstyle="text-align:center"><fontstyle="color:green">隆媒</font>745.9739</td>]
[<tdstyle="text-align:center">2001-12-31</td>,<tdstyle="text-align:center">-5.47</td>,<tdstyle="text-align:center"><fontstyle="color:green">隆媒</font>6.852</td>]
[<tdstyle="text-align:center">2000-12-31</td>,<tdstyle="text-align:center">6.82</td>,<tdstyle="text-align:center"><fontstyle="color:red">隆眉</font>3.95</td>]
[<tdstyle="text-align:center">1999-12-31</td>,<tdstyle="text-align:center">10.48</td>,<tdstyle="text-align:center"><fontstyle="color:red">隆眉</font>6.87</td>]
[<tdstyle="text-align:center">1998-12-31</td>,<tdstyle="text-align:center">12.28</td>,<tdstyle="text-align:center"><fontstyle="color:red">隆眉</font>7.21</td>]
[<tdstyle="text-align:center">1997-12-31</td>,<tdstyle="text-align:center">54</td>,<tdstyle="text-align:center"><fontstyle="color:green">隆媒</font>18</td>]
[<tdstyle="text-align:center">1996-12-31</td>,<tdstyle="text-align:center">72</td>,<tdstyle="text-align:center"><fontstyle="color:red">隆眉</font>7</td>]
[<tdstyle="text-align:center">1995-12-31</td>,<tdstyle="text-align:center">65</td>,<tdstyle="text-align:center">聽</td>]
不止2004年的數據
我修改了下你的代碼用的requests的庫
importos
importsys
importtime
importrequests
importbs4
frompprintimportpprint
roe=open('ROE.txt','w')
req="http://vip.stock.finance.sina.com.cn/corp/view/vFD_FinancialGuideLineHistory.php?stockid=600159&typecode=financialratios59"
soup=bs4.BeautifulSoup(requests.get(req,timeout=30).text)
buffer=soup.find(id='Table1')
rows=buffer.find_all('tr')
forrowinrows:
cols=row.find_all('td')
text=str(cols)
if"-12-31"intext:
roe.write(text+' ')
time.sleep(2)
roe.close()
⑨ python 怎麼提取html內容啊(正則)
python提取html內容的方法。如下參考:
1.首先,打開Python來定義字元串,在定義的字元串後面加上中括弧,然後在要提取的字元位置輸入。
⑩ 我打算用python去處理html的form表單,該怎麼實現
運用 web.py 框架
例如 index頁面有兩個輸入框
<form action='/index',method='post'>
<input type="text" name="name" id="name" />
<input type="text" name="pwd" id="pwd" />
</form>
那麼 在python 中
class index:
def GET(self, name):
inputall =web.input(name=None,pwd=None)
name= inputall.name
pwd= inputall.pwd
print print name ,pwd
def POST(self, name):
inputall =web.input(name=None,pwd=None)
name= inputall.name
pwd= inputall.pwd
print print name ,pwd
就得到了頁面提交的 name 和pwd