gpt4 book ai didi

用于自然语言处理的 Java 或 Python

转载 作者:IT老高 更新时间:2023-10-28 11:20:58 26 4
gpt4 key购买 nike

我想知道哪种编程语言更适合自然语言处理。 Java 还是 Python?我发现了很多关于它的问题和答案。但我仍然迷失在选择使用哪一个。

我想知道 Java 使用哪个 NLP 库,因为有很多库(LingPipe、GATE、OpenNLP、StandfordNLP)。对于 Python,大多数程序员推荐使用 NLTK。

但是,如果我要从非结构化数据(只是自由格式的纯英文文本)中进行一些文本处理或信息提取以获取一些有用的信息,那么最好的选择是什么? Java还是Python?合适的图书馆?

更新

我想做的是从非结构化数据中提取有用的产品信息(例如,用户用不是很标准的英语就手机或笔记本电脑制作不同形式的广告)

最佳答案

用于 NLP 的 Java 与 Python 在很大程度上是一种偏好或必要性。根据公司/项目,您需要使用其中一个或另一个,并且通常没有太多选择,除非您正在领导一个项目。

除了NLTK(www.nltk.org),python中其实还有其他的文本处理库强>:

(更多信息见https://pypi.python.org/pypi?%3Aaction=search&term=natural+language+processing&submit=search)

对于 Java,还有很多其他的,但这里有另一个列表:

这是基本字符串处理的一个很好的比较,见 http://nltk.googlecode.com/svn/trunk/doc/howto/nlp-python.html

GATE 与 UIMA 与 OpenNLP 的有用比较,请参阅 https://www.assembla.com/spaces/extraction-of-cost-data/wiki/Gate-vs-UIMA-vs-OpenNLP?version=4

如果您不确定 NLP 使用哪种语言,我个人会说,“任何可以为您提供所需分析/输出的语言”,请参阅 Which language or tools to learn for natural language processing?

这是最近(2017 年)的 NLP 工具:https://github.com/alvations/awesome-community-curated-nlp

旧的 NLP 工具列表 (2013):http://web.archive.org/web/20130703190201/http://yauhenklimovich.wordpress.com/2013/05/20/tools-nlp


除了语言处理工具之外,您还非常需要将 机器学习 工具整合到 NLP 管道中。

PythonJava 的范围很广,这再次取决于偏好以及库是否足够用户友好:

python 中的机器学习库:

(更多信息见https://pypi.python.org/pypi?%3Aaction=search&term=machine+learning&submit=search)


随着最近(2015)deep learning tsunami in NLP ,也许你可以考虑:https://en.wikipedia.org/wiki/Comparison_of_deep_learning_software

我会避免出于偏袒/中立的原因列出深度学习工具。


其他有关 NLP/ML 工具的 Stackoverflow 问题:

关于用于自然语言处理的 Java 或 Python,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22904025/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com