gpt4 book ai didi

python - 使用 urllib 将获取的数据以特定的结构化格式保存在文件中

转载 作者:太空宇宙 更新时间:2023-11-03 16:33:54 25 4
gpt4 key购买 nike

我想知道是否有办法以特定的结构化格式将 html 保存在我的文件中。现在这个脚本的输出只是一堆字母和数字。有没有一种方法可以构建它?例如:111.111.111.11:111222.222.222.22:22(IP格式)

感谢任何帮助!

import urllib.request
import re

ans = True

while ans:
print("""
- Menu Selection -
1. Automatic
2. Automatic w/Checker
3. Manual
4. Add to list
5. Exit
""")
ans = input('Select Option : ')

if ans =="1":
try :
with urllib.request.urlopen('http://www.mywebsite.net') as response:
html = response.read()
html = str(html)
html = re.sub(r'([a-z][A-Z])', '', html)
f = open('text.txt','a')
f.write(html)
f.close()
print('Data(1) saved.')
ans = True
except :
print('Error on first fetch.')

最佳答案

根据问题 -

如果示例输入是 -

输入 - fdsfdsfdsf123.123.123.123:123fdds125.125.125.125:125fdsfdfdsfdsfsdf

输出 - 123.123.123.123:123(换行)125.125.125.125:125

如果 html 是输入字符串 -

filtered_alpha = re.sub('[^0-9\.:]','\n', html)
multiple_ips = filter(None, filtered_alpha.split("\n"))
print "\n".join(multiple_ips)

这将为您提供预期的输出。

如果您专门寻找 ip_addresses,您可以引用 @MarkByers here 的帖子他提到的地方 -

ip = re.findall( r'[0-9]+(?:\.[0-9]+){3}', html)

关于python - 使用 urllib 将获取的数据以特定的结构化格式保存在文件中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37379627/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com