gpt4 book ai didi

Python程序从文本文件中提取文本?

转载 作者:行者123 更新时间:2023-12-01 05:12:08 26 4
gpt4 key购买 nike

我有一个通过转换 .srt 文件获得的文本文件。内容如下:

10:0:1,65 --> 0:0:7,85Hello, my name is Gareth, and in thisvideo, I'm going to talk about list comprehensions20:0:7,85 --> 0:0:9,749in Python.

I want only the words present the text file such that the output is a new textfile op.txt, with the output represented as:

Hellomyname isGarethand

and so on.

This is the program I'm working on:

import os, re
f= open("D:\captionsfile.txt",'r')
k=f.read()
g=str(k)
f.close()
w=re.search('[a-z][A-Z]\s',g)
fil=open('D:\op.txt','w+')
fil.append(w)
fil.close()

但是我从这个程序得到的输出是:

NoneNoneNone

最佳答案

如果我们假设 m 是一个单词,是 am 的缩写,并且 in.txt 是您的文本文件,您可以使用

import re

with open('in.txt') as intxt:
data = intxt.read()

x = re.findall('[aA-zZ]+', data)
print(x)

这将产生

['Hello', 'my', 'name', 'is', 'Gareth', 'and', 'in', 'this', 'video', 'I', 'm', 'going', 'to', 'talk', 'about', 'list', 'comprehensions', 'in', 'Python']

您现在可以使用以下命令将 x 写入新文件:

with open('out.txt', 'w') as outtxt:
outtxt.write('\n'.join(x))

获取

I'm

而不是

I
m

您可以使用re.findall('[aA-zZ\']+')

关于Python程序从文本文件中提取文本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23968446/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com