当前位置:首页 » 操作系统 » 糗事源码

糗事源码

发布时间: 2023-07-01 14:05:04

❶ android 夜间模式怎么实现

原理很简单:利用setTheme调用不同的风格,而白天与黑夜的区别就是在于夜间模式直接利用黑色背景,其他图片啊,背景啊,通通变成透明的,就可以了。
<!-- 默认风格 -->
<style name="BrowserThemeDefault" parent="@android:style/Theme">
<item name="bookimage">@drawable/day</item>
</style>

<!-- 夜间模式 --> 其实就是一张透明图片
<style name="BrowserThemeNight" parent="@android:style/Theme">
<item name="nightimage">@drawable/night</item>
</style>
切换程序:
if (blFlag) {
this.setTheme(R.style.BrowserThemeDefault);
blFlag = false;
} else {
this.setTheme(R.style.BrowserThemeNight);
blFlag = true;
}

python3.4 + requests + re 仿写糗事百科爬虫,遇到一个疑惑,求助

网上的Python教程大都是2.X版本的,python2.X和python3.X相比较改动比较大,好多库的用法不太一样,我安装的是3.4.1,就用3.4.1实现一下网页内容抓取
首先是库,2.7版本的urllib2库已经没有了,我导入的是:
import urllib.request
import re
首先是取得url,直接打开糗事网络直接复制网址
url='http//www..com/hot/'
然后设置headers,伪装成浏览器进行访问,有的网站会有屏蔽措施,设置过headers可以绕过屏蔽
user_agent='Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'
headers={'User-Agent':user_agent}
然后进行请求,这里3.4和2.7有点不一样,注意用法
request=urllib.request.Request(url=url,headers=headers)
然后获取响应结果,注意用法
response=urllib.request.urlopen(request)
此时就抓去了整个网页源代码,可以打印一下看看
content=response.read().decode('utf-8')
print(content)
如何抓取想要的内容呢?这里需要正则表达式去匹配
先看看部分源码的内容,如下:
<div class="article block untagged mb15" id='qiushi_tag_115326209'><div class="author clearfix"><a href="/users/6689931" target="_blank" rel="nofollow"><img src="http://pic.qiushike.com/system/avtnew/668/6689931/medium/20140301102643.jpg" alt="狼牙蝎子尾"/></a><a href="/users/6689931" target="_blank" title="狼牙蝎子尾"><h2>狼牙蝎子尾</h2></a></div><div class="content">“懒惰是可以战胜饥饿的 ”<br/><br/>“但却输给了尿”<!--1456774385--></div><div class="thumb"><a href="/article/115326209" target="_blank"><img src="http://pic.qiushike.com/system/pictures/11532/115326209/medium/app115326209.jpg" alt="懒惰是可以战胜饥饿的 " /></a></div><div class="stats"><span class="stats-vote"><i class="number">1702</i> 好笑</span><span class="stats-comments"><span class="dash"> · </span><a href="/article/115326209" data-share="/article/115326209" id="c-115326209" class="qiushi_comments" target="_blank"><i class="number">26</i> 评论
这是一条内容,可以看出,从<div ....author...开始到</i>结束
然后就写正则匹配
pattern=re.compile('<div.*?author clearfix">.*?<h2>(.*?)</h2>.*?<div.*?content">(.*?)<!--.*?-->.*?<img src="(.*?)" alt=.*?>.*?</i>')
再然后就可以获取内容了
items=re.findall(pattern,str(content))
由于控制台不能输出图片,就把带图片的过滤掉吧
for item in items:
haveImg=re.search('img',item[2])
if not haveImg:
print(item[0]),print(item[1])
然后运行即可
附上源码图片以及运行结果:
代码估计大家都能看懂,正则表达式可能新手不太理解
我稍微说一下
.*?代表一个固定搭配,指尽可能短的匹配
(.*?)代表一个分组,是我们抓取的内容
re.S说明可以匹配到换行,如果没有re.S就啥也取不到
这个代码是初稿,比较粗糙,有兴趣的可以把它改造成面向对象的模式

❸ 如何用python爬取网站数据

这里简单介绍一下吧,以抓取网站静态、动态2种数据为慧返拍例,实验环境win10+python3.6+pycharm5.0,主要内容如下:

抓取网站静态数据(数据在网页源码中):以糗事网络网站数据为例

1.这里假设我们抓取的数据如下,主要包括用户昵称、内容、好笑数和评论数这4个字段,如下:

对应的网页源码如下,包含我们所需要的数据:

2.对应网页结构,主要代码如下,很简单,主要用到requests+BeautifulSoup,其中requests用于请求页面,BeautifulSoup用于解析页面:

程序运行截图如下,已经成功爬取到数据:

抓取网站动态数据(数据不在网页源码中,json等文件中):以人人贷网站数据为例

1.这里假设我们爬取的是债券数据,主要包括年利率世型、借款标题、期限、金额和进度这5个字段信息,截图如下:

打开网页源码中,可以发现数据不在网页源码中,按F12抓包分析时,才发现在一个json文件中,如下:

2.获取到json文件的url后,我们就可以爬取对应数据了,这里使用的包与上面类似,因为是json文件,所以还用了json这个包(解析json),主要内容如下:

程序运行截图如下,前羡已经成功抓取到数据:

至此,这里就介绍完了这2种数据的抓取,包括静态数据和动态数据。总的来说,这2个示例不难,都是入门级别的爬虫,网页结构也比较简单,最重要的还是要会进行抓包分析,对页面进行分析提取,后期熟悉后,可以借助scrapy这个框架进行数据的爬取,可以更方便一些,效率更高,当然,如果爬取的页面比较复杂,像验证码、加密等,这时候就需要认真分析了,网上也有一些教程可供参考,感兴趣的可以搜一下,希望以上分享的内容能对你有所帮助吧。

❹ 求糗事百科源码

已发往你的 、邮箱、请去查看、包括垃圾邮箱

热点内容
vpn韩国服务器地址 发布:2025-03-20 07:12:44 浏览:25
打码软件源码 发布:2025-03-20 07:08:06 浏览:109
前端android 发布:2025-03-20 06:50:42 浏览:93
进制转换栈c语言 发布:2025-03-20 06:50:31 浏览:339
myeclipse不自动编译了 发布:2025-03-20 06:41:38 浏览:777
led汽车大灯和卤素灯该选哪个配置 发布:2025-03-20 06:40:55 浏览:917
sql网校 发布:2025-03-20 06:16:42 浏览:279
安卓手机图标排列为什么会混乱 发布:2025-03-20 06:16:05 浏览:761
手机pin初始密码是多少 发布:2025-03-20 06:15:59 浏览:900
javaif常量变量 发布:2025-03-20 06:15:57 浏览:344