gpt4 book ai didi

nlp - 有关以下自然语言处理术语的详细信息?

转载 作者:行者123 更新时间:2023-12-04 23:10:06 25 4
gpt4 key购买 nike

Named Entity Extraction (extract ppl, cities, organizations)
Content Tagging (extract topic tags by scanning doc)
Structured Data Extraction
Topic Categorization (taxonomy classification by scanning doc....bayesian )
Text extraction (HTML page cleaning)

是否有库可用于执行 NLP 的上述任何功能?

真的不想向 AlchemyAPI 支付现金

最佳答案

实际上有很多免费可用的开源自然语言处理包。下面是一个简短的列表,按工具包所使用的语言进行组织:

  • python :Natural Language Toolkit NLTK
  • Java :OpenNLP , Gate , 和 Stanford's JavaNLP
  • .NET :Sharp NLP

  • 如果您不确定该选择哪一个,我建议您从 NLTK 开始.该软件包相当易于使用,并且有大量在线文档,包括 a free book .

    您应该能够使用 NLTK 轻松完成您列出的 NLP 任务,例如 named entity recognition (NER) , extracting tags for documents , 和 document categorization .

    炼金术的人怎么称呼 structured data extraction看起来它只是 HTML 抓取,只要页面仍然以相同的方式在视觉上呈现,它就可以抵抗对底层 HTML 的更改。所以,这并不是真正的 NLP 任务。

    要从 HTML 中提取文本,只需使用 boilerpipe .它快速、良好且免费。

    关于nlp - 有关以下自然语言处理术语的详细信息?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2679733/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com