gpt4 book ai didi

machine-learning - 如何检测来自各种来源的表格数据

转载 作者:行者123 更新时间:2023-11-30 08:55:57 25 4
gpt4 key购买 nike

在我正在玩的一个实验项目中,我希望能够查看文本数据并检测它是否包含表格格式的数据。当然,有很多情况看起来像表格数据,所以我想知道我需要研究什么样的算法来寻找共同特征。

我的第一个想法是编写一个长的 switch/case 语句,检查由制表符分隔的数据,然后检查由管道符号分隔的数据的另一种情况,然后检查以另一种方式分隔的数据的另一种情况等。现在当然我意识到我必须列出要检测的不同事物的列表 - 但我想知道是否有一种比对每种类型进行相对较慢的搜索更智能的方法来检测这些特征。

我意识到这个问题并不是特别 Eloquent 地提出,所以我希望它有一定道理!

有什么想法吗?

(也不知道如何标记它 - 所以欢迎帮助!)

最佳答案

唯一可靠的方案是使用机器学习。例如,您可以在一堆表格和非表格 Material 的示例上训练感知器分类器。

关于machine-learning - 如何检测来自各种来源的表格数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1731744/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com