gpt4 book ai didi

Python3.4编程实现简单抓取爬虫功能示例

转载 作者:qq735679552 更新时间:2022-09-28 22:32:09 25 4
gpt4 key购买 nike

CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.

这篇CFSDN的博客文章Python3.4编程实现简单抓取爬虫功能示例由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.

本文实例讲述了Python3.4编程实现简单抓取爬虫功能。分享给大家供大家参考,具体如下:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
import urllib.request
import urllib.parse
import re
import urllib.request,urllib.parse,http.cookiejar
import time
def getHtml(url):
   cj = http.cookiejar.CookieJar()
   opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cj))
   opener.addheaders = [( 'User-Agent' , 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.101 Safari/537.36' ),( 'Cookie' , '4564564564564564565646540' )]
   urllib.request.install_opener(opener)
   page = urllib.request.urlopen(url)
   html = page.read()
   return html
#print ( html)
#html = getHtml("http://weibo.com/")
def getimg(html):
   html = html.decode( 'utf-8' )
   reg = '"screen_name":"(.*?)"'
   imgre = re. compile (reg)
   src = re.findall(imgre,html)
   return src
#print ("",getimg(html))
uid = [ '2808675432' , '3888405676' , '2628551531' , '2808587400' ]
for a in list (uid):
   print (getimg(getHtml( "http://weibo.com/" + a)))
   time.sleep( 1 )

希望本文所述对大家Python程序设计有所帮助.

原文链接:http://blog.csdn.net/macwhirr123/article/details/44623341 。

最后此篇关于Python3.4编程实现简单抓取爬虫功能示例的文章就讲到这里了,如果你想了解更多关于Python3.4编程实现简单抓取爬虫功能示例的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com