python正则url参数
‘壹’ python怎么做让正则只匹配输出url中的域名
代码如下(下方源代码部分url为空,请自行添加任意地址测试):
import re
url = ""
pattern = r'//(.+?)/'
domain = re.search(pattern,url).group(1)
print(domain)
‘贰’ Python 用正则表达式提取txt文件里包含的url的表达式
这种结构化的数据交换格式,按照约定的格式来解析是最好的,而不是去用正则,这样能准确的取出数据中对应位置的数据。像这样
#!/usr/bin/envpython
#-*-coding:utf-8-*-
importjson
withopen('google.txt')asf:
obj=json.loads(f.read())
urls=[e[0]foreinobj]
print(urls)
我用你上面的部分数据做了一个测试用的google.txt,这个运行的结果是
[u'http://en.wikipedia.org/wiki/403(b)', u'http://www.investopedia.com/terms/1/403bplan.asp']
‘叁’ python 正则表达式提取字典中的imUrl的value值
对于你给的字符串,可以被看作一个字典,所以可以按照键值来提取imUrl的value值,也可以用正则表达式提取imUrl的value值.
两种方法我都写出来了,你看看吧,要用哪种方法,你自己决定.(因为回答问题不能出现链接,所以我把imUrl的value值改成了'imUrl链接',意思是一样的)
第一种方法
data={'asin': '0000037214', 'related': {'also_viewed': ['B00JO8II76', 'B00DGN4R1Q', 'B00E1YRI4C']}, 'title': 'Purple Sequin Tiny Dancer Tutu Ballet Dance Fairy Princess Costume Accessory', 'price': 6.99, 'salesRank': {'Clothing': 1233557}, 'imUrl': 'imUrl链接', 'brand': 'Big Dreams','categories': [['Clothing, Shoes & Jewelry', 'Girls'], ['Clothing, Shoes & Jewelry', 'Novelty, Costumes & More', 'Costumes & Accessories', 'More Accessories', 'Kids & Baby']]}
print(data['imUrl'])
源代码(注意源代码的缩进)
‘肆’ python爬虫如何给url设置变量
url='http://xxxxxxx.simple.com/xxxxxxxx'
data={
'xxx':0,
'type':0,
'status':3,
'actName':''}
cookies={'xxxx':'xxxxxx',
'uid':'xxxxxx'}
data['xxx']=44
h=requests.get(url,params=data,cookies=cookies,timeout=3000)
#url可以通过h.url查看
requests可以通过params自动拼接
如果是urllib, 没用过, 只知道parse可以拼接参数
>>>importurllib
>>>urllib.parse.urlencode({"a":11,"b":22})
'a=11&b=22'
‘伍’ 这个python例子中如何用正则表达式提取url
import re
m=re.search(r'//[0-9A-Za-z./]+',url)
具体要考虑连接里的字符,以及其他地方的正文字符
‘陆’ python 获取url中参数 例 localhost:8080/loginuserid=1 我想获取到[userid,1]
这个要看你用什么框架来做了,要是用的django就是request.GET.get('userid'),这样返回1或None