gpt4 book ai didi

python - 从文件中提取单词

转载 作者:太空狗 更新时间:2023-10-30 02:06:15 25 4
gpt4 key购买 nike

我使用 python 打开一个文件,以查找打开的文件中是否存在一组预定义的单词。我将预定义的单词集放入列表中,然后打开需要测试的文件。现在有什么方法可以在 python 中提取单词而不是行。这让我的工作变得更加轻松。

最佳答案

import re

def get_words_from_string(s):
return set(re.findall(re.compile('\w+'), s.lower()))

def get_words_from_file(fname):
with open(fname, 'rb') as inf:
return get_words_from_string(inf.read())

def all_words(needle, haystack):
return set(needle).issubset(set(haystack))

def any_words(needle, haystack):
return set(needle).intersection(set(haystack))

search_words = get_words_from_string("This is my test")
find_in = get_words_from_string("If this were my test, I is passing")

print any_words(search_words, find_in)

print all_words(search_words, find_in)

返回

set(['this', 'test', 'is', 'my'])
True

关于python - 从文件中提取单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4963499/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com