gpt4 book ai didi

python - 读取包含制表符的行

转载 作者:行者123 更新时间:2023-12-01 00:46:08 25 4
gpt4 key购买 nike

我从 https://www.clres.com/db/parses/oec/abaft.parse 获得了一个文件 使用 urllib3。它有制表符,然后是\r\n。在 Python 2.7 中,我使用了 StringIO,但这在 Python 3.7 中不可用。

自从 StringIO 被淘汰后,我尝试使用 IO。

http = urllib3.PoolManager(timeout=10.0)
r = http.urlopen('GET', url, preload_content=False)
remote_file = r.data
memory_file = remote_file.decode('utf-8')
prep_sents = get_sentences(memory_file)
def get_sentence(memory_file):
sentence = []
for line in memory_file:
if not re.match(r'\s*\r?\n', line):

我希望得到一行,但我只得到一行中的第一个标记。

1\tWith\twith\t_\tIN\t_\t0\tROOT\t_\t_\t_\t_\t_\t_\r\n

最佳答案

StringIO 在 Python 3.7 中可用

from io import StringIO

memory_file 是一个字符串,因此要获取需要分割的每一行:

for line in memory_file.split('\n'):
print(line)

关于python - 读取包含制表符的行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56959094/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com