gpt4 book ai didi

用于文本分析和计数的 Java 库

转载 作者:行者123 更新时间:2023-12-01 14:50:35 25 4
gpt4 key购买 nike

我需要一个稳定的 Java 库,我可以向它传递一个巨大的字符串(例如,Moby Dick 中的几章)并获得类似“字数统计”的统计信息:

  • 段落数
  • 句子数量
  • 字数
  • 字符数

最好是可国际化/可本地化的东西,但不是必需的。我认为 Apache Commons 会有类似的东西,但经过彻底搜索后却没有。

我可以自己写这个,但可能会出现问题并且需要花费很多时间;另外,如果轮子已经存在,我不想重新发明轮子。我正在考虑使用 Apache Tika,但无法确认它是否能满足我的需要。它似乎可以处理字数统计,但不能处理其他内容。提前致谢。

最佳答案

看看 Apache Tika。它可能满足您的要求

关于用于文本分析和计数的 Java 库,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14910646/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com