gpt4 book ai didi

python - 从python句子中删除非英语单词

转载 作者:行者123 更新时间:2023-11-28 22:06:15 25 4
gpt4 key购买 nike

我编写了一段代码,用于向 Google 发送查询并返回结果。我从这些结果中提取片段(摘要)以进行进一步处理。然而,有时这些片段中会出现我不想要的非英语单词。例如:

/\u02b0w\u025bn w\u025bn unstressed \u02b0w\u0259n w\u0259n/ 

我只想要这句话中的“unstressed”这个词。我怎样才能做到这一点?谢谢

最佳答案

PyEnchant 对您来说可能是一个简单的选择。我不知道它的速度,但你可以这样做:

>>> import enchant
>>> d = enchant.Dict("en_US")
>>> d.check("Hello")
True
>>> d.check("Helo")
False
>>>

找到教程here ,它还有返回建议的选项,您可以再次查询其他查询或其他内容。此外,您可以检查您的结果是否为 latin-1 (is_utf8() 存在,不知道 is_latin-1() 是否也存在,也许使用类似 Enca 的东西,它基于以下内容检测文本文件的编码了解他们的语言。)

关于python - 从python句子中删除非英语单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4031556/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com