gpt4 book ai didi

python - 使用python从Instagram收集用户信息

转载 作者:太空宇宙 更新时间:2023-11-03 20:46:58 25 4
gpt4 key购买 nike

我目前正在使用 python 来收集 Instagram 用户的信息,使用包含 Instagram 用户链接的文本文件。虽然我可以收集关注者数量、关注者数量和帖子数量,但我希望能够收集用户的个人信息。收集生物信息将使我最终能够解析该信息并收集电子邮件。我能做到这一点的最好和最简单的方法是什么?

我在Python方面经验不足,所以我从互联网上获取了示例代码。我尝试分析代码并使用我所知道的来修改它以满足我的需要,但没有结果。

import requests
import urllib.request
import urllib.parse
import urllib.error
from bs4 import BeautifulSoup
import ssl
import json


class Insta_Info_Scraper:

def getinfo(self, url):
html = urllib.request.urlopen(url, context=self.ctx).read()
soup = BeautifulSoup(html, 'html.parser')
data = soup.find_all('meta', attrs= {'property':'og:description'})
text = data[0].get('content').split()
user = '%s %s %s' % (text[-3], text[-2], text[-1])
followers = text[0]
following = text[2]
posts = text[4]
email = ""
print ('User:', user)
print ('Followers:', followers)
print ('Following:', following)
print ('Posts:', posts)
print ('Email:', email)
print ('---------------------------')

def main(self):
self.ctx = ssl.create_default_context()
self.ctx.check_hostname = False
self.ctx.verify_mode = ssl.CERT_NONE

with open('users.txt') as f:
self.content = f.readlines()
self.content = [x.strip() for x in self.content]
for url in self.content:
self.getinfo(url)


if __name__ == '__main__':
obj = Insta_Info_Scraper()
obj.main()

目前,我将一个空字符串作为“email”变量的值,但希望最终将其替换为从特定用户获取电子邮件的代码。

最佳答案

访问 Instagram 公共(public)数据结构的便捷工具是 Instaloader ,一个 Python 包,提供 Python 模块和 CLI 来访问 Instagram。使用 pip install instaloader 安装它后,您可以使用

轻松获取保存在 JSON 文件中的配置文件元数据
instaloader --no-posts --no-profile-pic --no-compress-json profile1 [profile2 ...]

然后你可以使用jq ,“一个轻量级且灵活的命令行 JSON 处理器”,用于提取刚刚保存的信息,例如以下命令打印 profile1 的简介:

jq -r .node.biography profile1/profile1_*.json

同样,不离开 Python 来访问相同信息的方法:

import instaloader
L = instaloader.Instaloader()
profile = instaloader.Profile.from_username(L.context, 'profile1')
print(profile.biography)

关于python - 使用python从Instagram收集用户信息,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56525911/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com