gpt4 book ai didi

scala - 检查文件是否为 ORC 文件

转载 作者:行者123 更新时间:2023-12-04 01:14:28 24 4
gpt4 key购买 nike

我有一个程序,其输入应为 ORC 文件格式。

我希望能够检查提供的输入是否实际上是一个 ORC 文件。仅检查扩展名是不够的,因为用户可以省略扩展名。

例如,对于 Parquet,我们可以 check如果第一行包含“PAR1”。

ORC 是否有等效的方法?

最佳答案

令人恼火的是,它们与带有神奇字符串 ORC 的 parquet 文件有类似的东西,但它位于文件的末尾。

https://orc.apache.org/specification/ORCv0/

文件末尾前一个字节是Postscript,Postscript的最后三个字节是ORC所以你应该读最后4个字节应该是ORC什么的。

我会使用十六进制编辑器来验证这一点!

关于scala - 检查文件是否为 ORC 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63796983/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com