gpt4 book ai didi

algorithm - 分析未知结构和容错表

转载 作者:塔克拉玛干 更新时间:2023-11-03 05:13:45 25 4
gpt4 key购买 nike

我想分析具有相似数据、结构不同且标题也可能略有不同的表。

为了从表格中收集所有数据并将它们汇总起来,我遇到了几个问题。

第 1 步:我寻找标题关键字。搜索 if "cars==cars"是不可能的,因为标题可能显示为 "car"、"Car"或 "Cars"。也有可能是单词拼写错误。因此,遍历所有可能性也可能导致错误。当我寻找这个问题的解决方案时,我发现了模糊逻辑,但我会感谢其他方法。

第二步:我在表格中找到了想要的关键词,但是我怎么知道相关数据放在哪里呢?它可以在它下面,也可以在它旁边的右边单元格。是否有方法获取有关表的一般结构的信息?

最佳答案

步骤 a(第 1 部分)- 天真的实现是字典距离(因为你想处理拼写错误)

步骤 a(第 2 部分)- 使用同义词数据库/词库查找名称相似的列

步骤 b(第 1 部分)- 数据以与 header 相同的方式对齐 - 因此如果 header 垂直对齐,则数据也将垂直对齐

步骤 b(第 2 部分)- 相似的数据将具有相似的数据类型(原始字符串、数字、邮政编码),通过向右和向下检查,您可以检测到哪个是真正的方向。

关于algorithm - 分析未知结构和容错表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53204936/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com