当前位置:首页 » 编程语言 » python解析url参数

python解析url参数

发布时间: 2025-02-21 11:35:31

‘壹’ 用python怎么解析'%3cp%3e%e5%'

import urllib
rawurl=xxx
url=urllib.unquote(rawurl)

所用模块:urllib
所用函数:urllib.unquote()
案例
import urllib
rawurl = "%E6%B2%B3%E6%BA%90"url = urllib.unquote(rawurl)print url

输出
河源

问题扩展
urllib.unquote()目的是对url编码进行解码,与该函数对应的是编码函数urllib.quote()

123

>>> import urllib>>> urllib.quote("河源")'%E6%B2%B3%E6%BA%90

URL为何要编码、解码?
通常如果一样东西需要编码,说明这样东西并不适合传输。原因多种多样,如Size过大,包含隐私数据。对于Url来说,之所以要进行编码,是因为Url中有些字符会引起歧义。
例如,Url参数字符串中使用key=value键值对这样的形式来传参,键值对之间以&符号分隔,如/s?q=abc&ie=utf-8。如果你的value字符串中包含了=或者&,那么势必会造成接收Url的服务器解析错误,因此必须将引起歧义的&和=符号进行转义,也就是对其进行编码。
又如,Url的编码格式采用的是ASCII码,而不是Unicode,这也就是说你不能在Url中包含任何非ASCII字符,例如中文。否则如果客户端浏览器和服务端浏览器支持的字符集不同的情况下,中文可能会造成问题。

‘贰’ url里有tvid=398da32a9这个信息,怎么用python提取tvid等号后面的字符串

利用字符串匹配,这是url的参数,首先python 里面有专门解析url的包urllib,可以将url分成各个部分,你可以获取参数集合,或者你手动的根据?来截断字符串,?后面的就是参数集合的字符串了。i
然后split("&")可以将各个参数和值分开。
对每个参数q匹配,q.find("tvid="),如果能匹配到,则根据返回额index号,获取子串,q[index+5:]
就是最终想要的值了

‘叁’ Python3 如何对url解码

url编码:

import urllib

url = 'http://test.com/s?wd=哈哈' #如果尘铅早此网站编码是激蠢gbk的话派雀,需要进行解码,从gbk解码成unicode,再从Unicode编码编码为utf-8格式。

url = url.decode('gbk', 'replace')

print urllib.quote(url.encode('utf-8', 'replace'))

热点内容
邻区脚本 发布:2025-02-22 07:01:04 浏览:961
安卓手机怎么校正soc 发布:2025-02-22 06:36:58 浏览:508
商城总控源码 发布:2025-02-22 06:36:14 浏览:505
ipad怎么玩安卓区游戏 发布:2025-02-22 06:35:29 浏览:347
程序注释和编译功能 发布:2025-02-22 06:34:08 浏览:813
云电脑的密码是什么意思 发布:2025-02-22 06:27:43 浏览:241
安卓系统如何转为ios系统 发布:2025-02-22 05:57:54 浏览:238
安卓手机指纹解锁如何变面容 发布:2025-02-22 05:31:57 浏览:535
压缩燃烧 发布:2025-02-22 05:28:49 浏览:760
数据库的连接查询 发布:2025-02-22 05:24:31 浏览:921