gpt4 book ai didi

python - 推断字段分隔文件信息的库

转载 作者:太空宇宙 更新时间:2023-11-03 11:15:28 24 4
gpt4 key购买 nike

<分区>

我有各种由用户上传的“未知”字段分隔文件(我对它们的内容控制为零,甚至不知道它们将以“v”结尾),我想看看如果有现有库(希望在 python 中)推断出有关未知字段分隔文件的以下信息:

  • 标题所在的行号。
  • 是否有标题。
  • 分隔符是什么。
  • 如果在标题后跳过任何行

enter image description here

在上面的示例中,标题将从第 2 行开始,数据将从第 4 行开始(这里的分隔符是一个制表符,但上面的网格中没有显示)。

是否有任何开源库(ML/AI?)尝试根据前约 100 行数据推断文件标题信息?这是 Google 搜索的一种方法,但未指定任何软件包:https://www.computer.org/csdl/proceedings/hpcc/2016/4297/00/07828554.pdf .


更新:本质上,我正在寻找是否存在一个库(以任何语言),我可以在其中传递它只有前 100 行数据,它将是能够对(1)标题在哪一行(2)数据从哪一行开始进行有根据的猜测; (3) 分隔符是什么。

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com