gpt4 book ai didi

Python:查找文本中的单词列表并返回其索引

转载 作者:行者123 更新时间:2023-11-28 20:49:29 25 4
gpt4 key购买 nike

我必须处理纯文本文档,查找单词列表并在找到的每个单词周围返回一个文本窗口。我正在使用 NLTK .

我在 Stack Overflow 上找到了一些帖子,他们使用正则表达式来查找单词,但没有获取索引,只是打印出来。我不认为使用 RE 是正确的,因为我必须找到特定的词。

最佳答案

这就是你要找的:

  • 您可以使用 str.index 或 str.find:

文件内容:

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Morbi sollicitudin tortor et velit venenatis molestie. Morbi non nibh magna, quis tempor metus. 
Vivamus vehicula velit sit amet neque posuere id hendrerit sem venenatis. Nam vitae felis sem. Mauris ultricies congue mi, eu ornare massa convallis nec.
Donec volutpat molestie velit, scelerisque porttitor dui suscipit vel. Etiam feugiat feugiat nisl, vitae commodo ligula tristique nec. Fusce bibendum fermentum rutrum.

>>>a = open("file.txt").read()

>>>print a.index("vitae")
232
>>> print a.find("vitae")
232

--编辑--

好的,如果你在多个索引中有相同的词,请尝试使用生成器,

def all_occurences(file, str):
initial = 0
while True:
initial = file.find(str, initial)
if initial == -1: return
yield initial
initial += len(str)


>>>print list(all_occurences(open("file.txt").read(),"vitae"))
[232, 408]

关于Python:查找文本中的单词列表并返回其索引,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14307313/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com