python百度貼吧
1. 求助,怎麼利用python爬取貼吧帖子樓中樓的信息
你好,很高興為你解答問題! 到貼吧用戶服務中心找到被刪除的帖子並可以申請恢復。 如果是吧務刪除的,還可以請吧主後台恢復。 如果是自己刪除的,就不能查看和恢復了。 如果這個答案能夠幫到你,請及時採納噢,謝謝!
2. python3爬蟲爬百度貼吧decode("utf-8")出錯
我寫了下代碼。沒有編碼問題,是不是不用decode?
import requests
r1 = requests.get("http://tieba..com/f?ie=utf-8&kw=python&fr=search")
print(r1.text)
3. python抓取貼吧數據的腳本問題
代碼過長的話可以把源碼文件上傳到網路網盤然後在這里貼共享鏈接。或者代碼發到貼吧也是可以的。
4. 如何在chrome中跑自己的python腳本
前端工具
FireFox有Firebug前端工具,而對於Chrome瀏覽器,同樣有很好的前端工具。右鍵選擇『審查元素』或者快捷鍵 F12 ,即可看到一些開發寫的code,這對於獲取測試對象(測試控制項)的某些屬性很有幫助。
瀏覽器窗口的最大化以及大小設置,以及前進,後退
這里有幾點注意:
XXXX.get(URL)轉到URL地址
time.sleep(ns) 等待時間
XXXX.back( ) 返回到上一個瀏覽器
XXXX.forward() 前進到下一個瀏覽器
XXXX.set_window_size(width,height) width,height 我們可以自己根據需要設置。
XXXX.maximize() 窗口最大化
XXXX.title 得到瀏覽器的標題
XXXX.quit( ) 瀏覽器退出
XXXX.close( ) 瀏覽器關閉
import time —>保證腳本運行的穩定性
browser=webdriver.Chrome() —>調用Chrome瀏覽器
使用print()語句可以查看腳本是否運行正確
腳本如下
from selenium import webdriver
import time
browser=webdriver.Chrome()
first_url=」http://www..com」
browser.get(first_url)
print (「open the first url is %s」%first_url)
time.sleep(3)
second_url=」http://news..com」
print(『open the second url is %s』%second_url)
browser.get(second_url)
time.sleep(3)
print(「back to the first_url %s」%first_url)
browser.back()
time.sleep(2)
print (「forwar to the second_url %s」%first_url)
browser.forward()
time.sleep(2)
print(「設置瀏覽器高320,寬480顯示」)
browser.set_window_size(480,320)
time.sleep(2)
print(「瀏覽器最大化」)
browser.maximize_window()
title=browser.title
print (title)
browser.find_element_by_link_text(「貼吧」).click
time.sleep(3)
5. 【python寫的百度貼吧下載圖片】怎麼下載其他的圖片
看你代碼的意思就是匹配到第一個內容之後,完成下載,結束程序,所以只要加個循環就好了,具體的循環條件自己再看一下就好了