當前位置:首頁 » 編程語言 » python發微博

python發微博

發布時間: 2024-11-28 23:29:31

1. 如何通過python調用新浪微博的API來爬取數據

先上結論,通過公開的api如果想爬到某大v的所有數據,需要滿足以下兩個條件:
1、在你的爬蟲開始運行時,該大v的所有微博發布量沒有超過回溯查詢的上限,新浪是2000,twitter是3200。
2、爬蟲程序必須不間斷運行。
新浪微博的api基本完全照搬twitter,其中介面的參數特性與底層的Nosql密不可分,建議先看點Nosql資料庫的設計理念有助於更好的理解api設計。
一般來說,如果決定爬某個大v,第一步先試獲取該用戶的基本信息,中間會包含一條最新的status,記下其中的id號作為基準,命名為baseId。
介面中最重要的兩個參數:
since_id:返回ID比since_id大的微博(即比since_id時間晚的微博),默認為0。
max_id:返回ID小於或等於max_id的微博,默認為0。
出於各種原因,獲取statuses的介面,固定為按id降序排列(scan_index_forward=false),即最新的statuses返回在前。假設該微博第一天上線,就一個用戶,發了一百條,id是1到100。而你在該用戶發了第50條的時候開始運行的爬蟲,即baseId=50。

2. 現在python微博爬蟲可以爬到用戶注冊地址嗎

現在python微博爬蟲不可租知族以爬到用戶注冊地址。爬蟲要實現的是爬取某個用戶的關注和粉絲的弊弊用戶公開基猛豎本信息,包括用戶昵稱、id、性別、所在地和其粉絲數量。

熱點內容
iphone如何設置像安卓動態壁紙 發布:2024-11-29 01:37:50 瀏覽:474
電腦如何避過聯網查配置 發布:2024-11-29 01:25:16 瀏覽:972
期貨軟體編程 發布:2024-11-29 01:13:16 瀏覽:834
如何下載加密pdf文件 發布:2024-11-29 01:09:21 瀏覽:325
高通android開發 發布:2024-11-29 01:09:11 瀏覽:693
xp電腦無線網密碼怎麼看密碼 發布:2024-11-29 01:08:30 瀏覽:123
戀愛劇腳本 發布:2024-11-29 00:59:58 瀏覽:575
安卓官方版陰陽師在哪裡下載 發布:2024-11-29 00:59:50 瀏覽:416
全球有多少忘記密碼丟失的比特幣 發布:2024-11-29 00:59:02 瀏覽:668
蘋果手機如何操作安卓三大鍵 發布:2024-11-29 00:58:55 瀏覽:165