当前位置:首页 » 编程语言 » python正则url参数

python正则url参数

发布时间: 2023-09-12 06:09:17

‘壹’ python怎么做让正则只匹配输出url中的域名

代码如下(下方源代码部分url为空,请自行添加任意地址测试):



import re
url = ""
pattern = r'//(.+?)/'
domain = re.search(pattern,url).group(1)
print(domain)

‘贰’ Python 用正则表达式提取txt文件里包含的url的表达式

这种结构化的数据交换格式,按照约定的格式来解析是最好的,而不是去用正则,这样能准确的取出数据中对应位置的数据。像这样

#!/usr/bin/envpython
#-*-coding:utf-8-*-
importjson
withopen('google.txt')asf:
obj=json.loads(f.read())
urls=[e[0]foreinobj]
print(urls)

我用你上面的部分数据做了一个测试用的google.txt,这个运行的结果是

[u'http://en.wikipedia.org/wiki/403(b)', u'http://www.investopedia.com/terms/1/403bplan.asp']

‘叁’ python 正则表达式提取字典中的imUrl的value值

对于你给的字符串,可以被看作一个字典,所以可以按照键值来提取imUrl的value值,也可以用正则表达式提取imUrl的value值.

两种方法我都写出来了,你看看吧,要用哪种方法,你自己决定.(因为回答问题不能出现链接,所以我把imUrl的value值改成了'imUrl链接',意思是一样的)

第一种方法

data={'asin': '0000037214', 'related': {'also_viewed': ['B00JO8II76', 'B00DGN4R1Q', 'B00E1YRI4C']}, 'title': 'Purple Sequin Tiny Dancer Tutu Ballet Dance Fairy Princess Costume Accessory', 'price': 6.99, 'salesRank': {'Clothing': 1233557}, 'imUrl': 'imUrl链接', 'brand': 'Big Dreams','categories': [['Clothing, Shoes & Jewelry', 'Girls'], ['Clothing, Shoes & Jewelry', 'Novelty, Costumes & More', 'Costumes & Accessories', 'More Accessories', 'Kids & Baby']]}

print(data['imUrl'])

源代码(注意源代码的缩进)

‘肆’ python爬虫如何给url设置变量

url='http://xxxxxxx.simple.com/xxxxxxxx'
data={
'xxx':0,
'type':0,
'status':3,
'actName':''}
cookies={'xxxx':'xxxxxx',
'uid':'xxxxxx'}

data['xxx']=44
h=requests.get(url,params=data,cookies=cookies,timeout=3000)

#url可以通过h.url查看

requests可以通过params自动拼接

如果是urllib, 没用过, 只知道parse可以拼接参数

>>>importurllib
>>>urllib.parse.urlencode({"a":11,"b":22})
'a=11&b=22'

‘伍’ 这个python例子中如何用正则表达式提取url

import re
m=re.search(r'//[0-9A-Za-z./]+',url)

具体要考虑连接里的字符,以及其他地方的正文字符

‘陆’ python 获取url中参数 例 localhost:8080/loginuserid=1 我想获取到[userid,1]

这个要看你用什么框架来做了,要是用的django就是request.GET.get('userid'),这样返回1或None

热点内容
滑板鞋脚本视频 发布:2025-02-02 09:48:54 浏览:432
群晖怎么玩安卓模拟器 发布:2025-02-02 09:45:23 浏览:557
三星安卓12彩蛋怎么玩 发布:2025-02-02 09:44:39 浏览:743
电脑显示连接服务器错误 发布:2025-02-02 09:24:10 浏览:537
瑞芯微开发板编译 发布:2025-02-02 09:22:54 浏览:146
linux虚拟机用gcc编译时显示错误 发布:2025-02-02 09:14:01 浏览:233
java驼峰 发布:2025-02-02 09:13:26 浏览:651
魔兽脚本怎么用 发布:2025-02-02 09:10:28 浏览:532
linuxadobe 发布:2025-02-02 09:09:43 浏览:212
sql2000数据库连接 发布:2025-02-02 09:09:43 浏览:726