python正則url參數
『壹』 python怎麼做讓正則只匹配輸出url中的域名
代碼如下(下方源代碼部分url為空,請自行添加任意地址測試):
import re
url = ""
pattern = r'//(.+?)/'
domain = re.search(pattern,url).group(1)
print(domain)
『貳』 Python 用正則表達式提取txt文件里包含的url的表達式
這種結構化的數據交換格式,按照約定的格式來解析是最好的,而不是去用正則,這樣能准確的取出數據中對應位置的數據。像這樣
#!/usr/bin/envpython
#-*-coding:utf-8-*-
importjson
withopen('google.txt')asf:
obj=json.loads(f.read())
urls=[e[0]foreinobj]
print(urls)
我用你上面的部分數據做了一個測試用的google.txt,這個運行的結果是
[u'http://en.wikipedia.org/wiki/403(b)', u'http://www.investopedia.com/terms/1/403bplan.asp']
『叄』 python 正則表達式提取字典中的imUrl的value值
對於你給的字元串,可以被看作一個字典,所以可以按照鍵值來提取imUrl的value值,也可以用正則表達式提取imUrl的value值.
兩種方法我都寫出來了,你看看吧,要用哪種方法,你自己決定.(因為回答問題不能出現鏈接,所以我把imUrl的value值改成了'imUrl鏈接',意思是一樣的)
第一種方法
data={'asin': '0000037214', 'related': {'also_viewed': ['B00JO8II76', 'B00DGN4R1Q', 'B00E1YRI4C']}, 'title': 'Purple Sequin Tiny Dancer Tutu Ballet Dance Fairy Princess Costume Accessory', 'price': 6.99, 'salesRank': {'Clothing': 1233557}, 'imUrl': 'imUrl鏈接', 'brand': 'Big Dreams','categories': [['Clothing, Shoes & Jewelry', 'Girls'], ['Clothing, Shoes & Jewelry', 'Novelty, Costumes & More', 'Costumes & Accessories', 'More Accessories', 'Kids & Baby']]}
print(data['imUrl'])
源代碼(注意源代碼的縮進)
『肆』 python爬蟲如何給url設置變數
url='http://xxxxxxx.simple.com/xxxxxxxx'
data={
'xxx':0,
'type':0,
'status':3,
'actName':''}
cookies={'xxxx':'xxxxxx',
'uid':'xxxxxx'}
data['xxx']=44
h=requests.get(url,params=data,cookies=cookies,timeout=3000)
#url可以通過h.url查看
requests可以通過params自動拼接
如果是urllib, 沒用過, 只知道parse可以拼接參數
>>>importurllib
>>>urllib.parse.urlencode({"a":11,"b":22})
'a=11&b=22'
『伍』 這個python例子中如何用正則表達式提取url
import re
m=re.search(r'//[0-9A-Za-z./]+',url)
具體要考慮連接里的字元,以及其他地方的正文字元
『陸』 python 獲取url中參數 例 localhost:8080/loginuserid=1 我想獲取到[userid,1]
這個要看你用什麼框架來做了,要是用的django就是request.GET.get('userid'),這樣返回1或None