gpt4 book ai didi

python - 使用 Python 读取网站上的每一行

转载 作者:行者123 更新时间:2023-11-30 23:08:13 26 4
gpt4 key购买 nike

我希望在有行的情况下读取网页上的每一行。到目前为止我有下面的代码。我无法让它为 temp 分配每行的值,我希望使用正则表达式来检查该行是否符合特定格式。

#!/usr/bin/python

import urllib2
import re

#imported urllib to collect the data. imported re for regular expressions to test format.


#creating our output file
f=open("OUIoutput.txt", "w+")

#opening a file like object using urllib
webpage= urllib2.urlopen("https://code.wireshark.org/review/gitweb?p=wireshark.git;a=blob_plain;f=manuf")


#string used to store the output
str1=""

#string used to store current line
temp=""



#while loop to read in the data for every line.INCORRECT FOR LOOP BASIC PLACEHOLDER IN THE CODE
for i in (60,500):
temp=webpage.readline(i)
if re.search("\w\w:\w\w:\w\w", temp):
str1+=temp

f.write(str1)

最佳答案

根据您的评论回答:

您不需要为此使用范围。 readlines () 函数就是您正在寻找的。

for line in webpage.readlines():
#do your work here

关于python - 使用 Python 读取网站上的每一行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31821879/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com