gpt4 book ai didi

Python爬取商家联系电话以及各种数据的方法

转载 作者:qq735679552 更新时间:2022-09-27 22:32:09 35 4
gpt4 key购买 nike

CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.

这篇CFSDN的博客文章Python爬取商家联系电话以及各种数据的方法由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.

上次学会了爬取图片,这次就想着试试爬取商家的联系电话,当然,这里纯属个人技术学习,爬取过后及时删除,不得用于其它违法用途,一切后果自负.

首先我学习时用的是114黄页数据.

下面四个是用到的模块,前面2个需要安装一下,后面2个是python自带的.

?
1
2
3
4
import requests
from bs4 import beautifulsoup
import csv
import time

然后,写个函数获取到页面种想要的数据,记得最后的return返回一下,因为下面的函数要到把数据写到csv里面.

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
def get_content(url,data = none):
  header = {
   'accept' : 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8' ,
   'accept-encoding' : 'gzip, deflate' ,
   'accept-language' : 'zh-cn,zh;q=0.8' ,
   'user-agent' : 'mozilla/5.0 (windows nt 10.0; win64; x64) applewebkit/537.36 (khtml, like gecko) chrome/59.0.3071.104 safari/537.36' ,
  }
  r = requests.get(url, headers = header)
  soup = beautifulsoup(r.content, 'html.parser' )
  data = soup.body.find( 'div' ,{ 'id' : 'news_con' })
  ul = data.find( 'ul' )
  lis = ul.find_all( 'li' )
  pthons = []
 
  for item in lis:
   rows = []
   name = item.find( 'h4' ).string
   rows.append(name)
   tel = item.find_all( "div" )[ 2 ].string
   rows.append(tel)
   pthons.append(rows)
   time.sleep( 1 )
  return pthons

接着:把数据写到表格里面。我这里用到的是csv,方便阅览.

?
1
2
3
4
5
6
7
def write_data(data,name):
  file_name = name
  with open (file_name, "w" , newline = '') as csvfile:
   writer = csv.writer(csvfile)
   writer.writerow([ "商铺名称" , "联系电话" ])
   writer.writerows(data)
   print ( '抓取完成' )

最后就是执行这些函数:

?
1
2
3
4
if __name__ = = '__main__' :
  url = 'http://ty.114chn.com/customerinfo/customers?cid=008004008&page=2'
  mydata = get_content(url)
  write_data(mydata, 'phone.csv' )

在这里我想到应该把url写成动态的,因为这里面有页数。让page写成循环自动+1,当然,可以在网页看到一共多少页。写个循环执行。就更完美了.

Python爬取商家联系电话以及各种数据的方法

以上这篇python爬取商家联系电话以及各种数据的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持我.

原文链接:https://blog.csdn.net/well2049/article/details/79115115 。

最后此篇关于Python爬取商家联系电话以及各种数据的方法的文章就讲到这里了,如果你想了解更多关于Python爬取商家联系电话以及各种数据的方法的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。

35 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com