gpt4 book ai didi

python - 自动更正拼写检查器

转载 作者:太空狗 更新时间:2023-10-29 20:23:09 25 4
gpt4 key购买 nike

我有一个 TSV(制表符分隔值)文件,我需要对拼写错误和组合词(即“我爱你”与“我爱你”)进行拼写检查。

我已经在我的机器上安装了 Aspell,并且可以使用 aspell() 函数通过 R 运行它。

files <- "train2.tsv"
res <- aspell(files)
str(res)
summary(res)

但是,在 R 中运行它的输出只是一个拼写错误的单词列表和可能的建议。

>  summary(res)
Possibly mis-spelled words:
[1] "amant" "contaneir" "creat" "ddition" "EssaySet" "EssayText" "experiament" "expireiment" "expirement"
[10] "Fipst" "infomation" "Inorder" "measureing" "mintued" "neccisary" "officialy" "renuminering" "rinsen"
[19] "sticlenx" "sucessfully" "tipe" "vineager" "vinigar" "yar"

> str(res)
Classes ‘aspell’ and 'data.frame': 27 obs. of 5 variables:
$ Original : chr "EssaySet" "EssayText" "expirement" "expireiment" ...
$ File : chr "train2.tsv" "train2.tsv" "train2.tsv" "train2.tsv" ...
$ Line : int 1 1 3 3 3 3 3 3 6 6 ...
$ Column : int 4 27 27 108 132 222 226 280 120 156 ...
$ Suggestions:List of 27
..$ : chr "Essay Set" "Essay-Set" "Essayist" "Essays" ...
..$ : chr "Essay Text" "Essay-Text" "Essayist" "Sedatest" ...
..$ : chr "experiment" "excrement" "excitement" "experiments" ...
..$ : chr "experiment" "experiments" "experimenter" "excrement" ...
..$ : chr "Amandy" "am ant" "am-ant" "Amanda" ...
..$ : chr "year" "ya" "Yard" "yard" ...

有没有办法让 aspell(或任何其他拼写检查器)自动更正拼写错误的单词?

最佳答案

看起来您可以执行以下操作:

s = load_up_users_dictionary()

for word in text_to_check:
if word not in s:
new_words = s.suggest( word )
replace_incorrect_word( word, new_words[0] )#Pick the first word from the returned list.

只需快速浏览一下文档,这看起来就像您必须执行的操作才能自动使用建议的正确拼写。

http://0x80.pl/proj/aspell-python/index-c.html

编辑:意识到您可能不是在寻找 python 代码,但这是使用 python 执行此操作的最简单方法,因为问题已用 python 标记。可能有更有效的方法,但为时已晚,首先想到的是这个。

关于python - 自动更正拼写检查器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11372700/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com