gpt4 book ai didi

excel - 制表符分隔数据集中拼写错误的描述性统计

转载 作者:行者123 更新时间:2023-12-04 21:02:58 25 4
gpt4 key购买 nike

我正在尝试在 Excel 中编写一个宏,以查找以制表符分隔格式(特别是一组推文)的自然语言文本数据集中拼写错误的平均偏差和标准偏差。通过对选项卡执行 CTRL+F 以获取消息数量并查看 SpellCheck 中列出的错误总数,我可以很容易地找到 Word 中的平均值。不过,这对 SD 没有帮助。据我所知,专门构建的语言分析软件无法在不计算诸如不流利(“ugh”,“ach”)之类的东西的情况下搜索一般的非单词。

我不知道如何在 Excel 宏中包含拼写和语法错误,或者如何按单元格将它们分开。

数据集足够大,我不介意细微的不准确(它们不应该在条件之间系统地变化)。

可以调整此工具以评估基本写作技巧或在足够大的写作样本中比较英语的非标准用法。任何帮助表示赞赏。

最佳答案

由于 Word 具有检测拼写和语法错误的内置功能,因此您可以在 Excel 中创建跨程序脚本​​。您只需让 Word 进行语言处理,而 Excel 进行统计分析。您需要从 Excel VBE 的“工具”>“引用”菜单中启用 Microsoft Word 15.0 对象库。

Word 中的 VBA 允许您检测是否存在拼写错误。请参阅此链接:

https://msdn.microsoft.com/en-us/library/office/aa171830(v=office.11).aspx

代码背后的逻辑是:

  • 在 Excel 中,打开一个新的 Word 文档。
  • 对于每条推文,复制单元格的内容并粘贴到空白的 Word 文档中。
  • 让 Word 扫描文档以查找错误,如果检测到则返回 True,否则返回 False。
  • 在 Excel 中,如果您获得 True 值,则在推文旁边插入 1,如果为 False,则插入 2。
  • 清除 Word 文档中的所有内容。
  • 转到 Excel 中的下一条推文(下一个单元格),然后执行步骤 2-6,直到每条推文旁边都有一个 1 或 2。

  • 您应该能够将语言错误的发生与其他变量相关联,例如 Twitter 句柄。

    本质上,让每个程序做它最擅长的事情。

    关于excel - 制表符分隔数据集中拼写错误的描述性统计,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32447516/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com