gpt4 book ai didi

python - Python 中的机器学习 : scikit-learn/Pybrain

转载 作者:行者123 更新时间:2023-11-30 09:21:32 25 4
gpt4 key购买 nike

我阅读了一些教程和介绍,但我不确定我是否掌握了其中的窍门,最重要的是,我不确定我是否完全理解 ML 与 NN。

假设我想指导一个程序(例如 scikit-learn),以便它有一些语言字典作为其输入集。例如,我有一本大型意大利语单词字典,可以将其作为数组数组输入(数组中的每一项都是一个单词,每个单词都是一个 ascii 值数组,一个对应世界上的每个字符):

[
[112, 105, 122, 122, 97], // pizza
[109, 097, 109, 109, 97], // mamma
...
]

是否可能/什么是最好的库/如何做到这一点:

  1. 给定一个单词,让程序推断它是否可能是意大利语单词,以便“mafia”被识别为潜在的实际意大利语单词,但“Eichhörnchen”不是(它比平均意大利世界长,它包含像“rnch”这样的序列在初始集中找不到,它包含“ö”,这是意大利语中未使用的字符)
  2. 根据初始集合生成其他(可能的)意大利语单词。例如,“potomo”并不是一个真正的意大利语单词,但根据意大利语正字法,它可能

最佳答案

我认为可以使用朴素贝叶斯分类和KNN。朴素贝叶斯分类被证明可以过滤垃圾邮件,但在此之前你需要一个同义词库。

关于python - Python 中的机器学习 : scikit-learn/Pybrain,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35801405/

25 4 0
文章推荐: java - 将箭头绘制到圆圈
文章推荐: machine-learning - HDP(分层狄利克雷过程)能否从数据中检测到主题的数量?
文章推荐: javascript - 如何在每个给定的时间间隔连续移动
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com