gpt4 book ai didi

text - 用于生成随机但真实的文本的库或工具

转载 作者:行者123 更新时间:2023-12-04 18:16:54 26 4
gpt4 key购买 nike

我正在寻找用于生成随机但真实的文本的工具。我自己实现了一个马尔可夫链文本生成器,尽管结果令人鼓舞,但我在改进它们方面的尝试并未取得任何成功。

我对使用语料库或基于上下文敏感或上下文无关语法进行操作的工具感到满意。我希望该工具适合包含在另一个项目中。
我最近的大部分工作都使用Java,因此首选使用该语言的工具,但是我对C#,C,C++甚至JavaScript都没问题。

这类似于question,但范围更大。

最佳答案

如果您想要“随机”文本,那么扩展自己的Markov链生成器可能是最好的选择。生成具有上下文的东西是一个开放的研究问题。

尝试(如果尚未尝试):

  • 单独对标点符号进行标记,或者如果您还没有标点符号,请在链中包括标点符号。这包括段落标记。
  • 如果您使用的是2或3历史马尔可夫链,请在遇到句号或换行符时尝试重置为使用1历史的马尔可夫链。


  • 另外,您可以在语料库中通过两遍使用 WordNet:
  • 分析句子以确定单词类型的常见序列,即名词,动词,形容词和副词。 WordNet包括这些。其他所有东西(代词,连词,等等)都被排除在外,但是您基本上可以直接通过。
    这将把“快速的棕色狐狸跳过懒狗”变成“[形容词] [名词]的[形容词] [形容词] [名词] [动词]“
  • 通过随机选择模板句子并用实际形容词名词和动词替换[形容词],[名词]和[动词]来复制句子。

  • 这种方法也存在很多问题:例如,您需要从周围的单词中获取上下文,以了解选择哪个同音异义词。在词网中查找“快速”会产生有关快速的信息,但也有一点点指甲。

    我知道这不能解决您对库或工具的需求,但可能会给您一些想法。

    关于text - 用于生成随机但真实的文本的库或工具,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1670867/

    26 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com