pythonbs
A. python中bs4.beautiful解析有時候不加前邊的bs4 有什麼區別
這個就是看你是如何import包的
如果是import bs4,那麼就應該是bs4.BeautifulSoup
如果是from bs4 import BeautifulSoup,就可以直接使用BeautifulSoup
B. python bs4分析html時,怎麼找到最底層的某個標簽
frombs4importBeautifulSoup
of=open(r'test.html','r')
html_doc=of.readlines()
of.close()
soup=BeautifulSoup(' '.join(html_doc),'html.parser')
printsoup.body.p
<!DOCTYPEhtml>
<html>
<head>
<title>test</title>
</head>
<body>
<p>
<b>xxxxxxxxx</b>
</p>
<b>
<ahref="aasdfd"></a>
<ahref="aasdfd"></a>
</b>
</body>
</html>
C. Python適合用來開發一個基於B/S的信息管理系統嗎
如授權,考核等相關的系統。
問題補充:greatghoul 寫道這種類型的系統,用python做問題不大。python開發web應用還是很給力的。python在js方面好用嗎,因為管理類系統可能注重交互,界面等,可能很多時候需要用JS來處理一些東西。django中好不好用呢。 問題補充:xuehua1987 寫道建議不要用python去做c/s管理方面的系統,你可以選擇其它面向對象的語言比如C#.為什麼呢?能不能講講有什麼不好的地方? 問題補充:xuehua1987 寫道因為python是一種偏向於腳本類型的語言,由於他語法的靈和性,他更適合於和其他語言一起使用,比如我有一個系統是用java開發的,但是我發現有些問題用python去處理,就更簡單,這時我就可以用java去調用python寫的部分。目前python可視化操作的IDE還很少,你要用python寫出即漂亮又復雜的圖形化界面很麻煩。使用其它語言,比如java,C#,你可以簡簡單單做出很絢麗的界面。我的意思是B/S模式的管理系統,不是C/S,所以只是考慮用python來做web開發。不是做GUI。如何?
D. python里利用bs4如何依次訪問源代碼的子節點
123456789def get_number_with_2child(self): if self.left and self.right: return 1+self.left.get_number_with_2child()+self.right.get_number_with_2child() elif self.left: return self.left.get_number_with_2child() elif self.rught: return self.right.get_number_with_2child() else: return 0
E. python 正則表達式 \bs*.\Se\b與\bs\S*e\b的含義解釋
實測:
>>>res=re.compile(r's*.Se')
>>>resl=re.findall(res,txt)
>>>resl
['site','sue','see','sse','ssee']
>>>res=re.compile(r'sS*?e')
>>>resl=re.findall(res,txt)
>>>resl
['site','sue','see','sse','ssee','somewhere']
第一個正則:
——單詞分界,
s*——0個或多個s
.——任一字元
S——任一非空字元
e——字母e
——單詞分界
第一個正則是錯誤的,它還可以匹配 "are"、"ss[一個空格]re",等不符合要求的內容。
後者是可以匹配到的。
F. python3.5網路爬蟲中bsObj = BeautifulSoup(html.read())和bsObj = BeautifulSoup(html)有區別嗎
這不是報錯 這是代碼不兼容產生的 警告提示
換一下寫法就可以了
#bsObj = BeautifulSoup(html)
bsObj = BeautifulSoup(html, "lxml")
G. PYTHON requests BS4模塊能否替換網頁內容,然後再保存
用re查到位置,
字元串替換,
在本地打開HTML文檔時,
圖片成功替換
H. python,用bs4對象篩選時,抓到的標簽為空為啥是空,為啥是空呢!
你的圖片,為啥看不見呢?為啥看不見呢?為啥不貼文字代碼呢?為啥不貼文字代碼呢?……
一般來說,有可能是你層級問題搞錯了,或者你多級查找的時候,上層的find的對象其實有多個,而你需要的並非是第一個,比如
<divclass="1"></div>
<divclass="1"><ahref="2222">1111</a></div>
這時候你find(div,attrs={"class":"1"}).find(a).text是肯定有問題的,因為第一個find是找到的上面的div
I. python是開發BS還是CS的啊
Python是一種通用的編程語言,B/S和C/S都能做
Python做的網站不像PHP和ASP.Net,一般都不帶擴展名py的
國內用Python支撐的網站比較少,比如有豆瓣:http://www.douban.com/
J. 為什麼Python安裝了bs4之後還是不能使用,用了多種方法安裝都不行。求大神指點
I guess the reason is:
You use the python3, but the mole is installed at python2.
I suggest you to use virtualenv to manage your projects.