gpt4 book ai didi

parsing - 如何以编程方式猜测 CSV 文件是逗号分隔还是分号分隔

转载 作者:行者123 更新时间:2023-12-04 01:12:59 25 4
gpt4 key购买 nike

在大多数情况下,CSV 文件是记录以逗号分隔的文本文件。但是,有时这些文件会以分号分隔。 (如果区域设置将小数点分隔符设置为逗号,Excel 将在保存 CSV 时使用分号分隔符——这在欧洲很常见。引用:http://en.wikipedia.org/wiki/Comma-separated_values#Application_support)

我的问题是,让程序猜测是用逗号还是分号分隔的最佳方法是什么?

例如像 1,1;1,1 这样的线可能不明确。它可以解释为逗号分隔:
1
1;1(一个字符串)
1

或分号分隔为
1,1
1,1

到目前为止,我最好的猜测是尝试使用 , 和 ; 解析文件。分隔符,然后选择与第一行(通常是标题行)具有相同长度的行最多的解析。如果两者的行数相同,请选择具有更多列的那一项。这样做的主要缺点是额外的开销。

想法?

最佳答案

根据您正在使用的内容,如果您保证有标题行,那么您尝试两者的方法可能是最佳的整体实践。然后一旦你确定发生了什么,如果你进一步向下一行没有所需的列数,那么你就会知道格式不正确。

通常,我会将其视为上传时用户指定的选项,而不是程序化测试。

关于parsing - 如何以编程方式猜测 CSV 文件是逗号分隔还是分号分隔,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2789695/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com