gpt4 book ai didi

python - 在 Ruby 中解析 ESRI 形状文件

转载 作者:太空宇宙 更新时间:2023-11-03 16:45:22 25 4
gpt4 key购买 nike

所以我目前正在尝试获取一些由第 3 方提供商提供的 map 数据。除了数据转储,他们没有给我们任何东西,因此没有文档或联系点来查看他们之前使用的是什么。

我有 4 个文件:

30083_parcel.dbf

30083_parcel.prj

30083_parcel.shp

30083_parcel.shx

现在,无需深入讨论不必要的细节,我已经成功地从 dbf prjshp 文件中提取并获取了工作数据。但是,我在使用 shx 时遇到了很多麻烦。

根据维基百科关于 SHX 文件规范的条目:

The index contains the same 100-byte header as the .shp file, followed by any number of 8-byte fixed-length records which consist of the following two fields:

Bytes Type Endianness Usage
0–3 int32 big Record offset (in 16-bit words)
4–7 int32 big Record length (in 16-bit words)

所以,我尝试了一些类似的方法:

File.open('test.txt') do|file|
until file.eof?
buffer = file.read(100)
# Do something with buffer
puts buffer
end
end

我得到的只是一些疯狂的角色,比如HP。我不确定去哪里进一步获取有用的检索记录偏移量和记录长度。

有什么想法吗?我想通过使用 file.read(100) 我会得到标题并且至少能够看到它们,但事实并非如此。在尝试访问前 100 个字节之后的其余部分后,我得到了类似的随机 unicode。

现在我也愿意接受非 ruby​​ 解决方案。

最佳答案

shp 文件是几何体,是二进制格式,包括 bug endian 和 little endian 整数和 float 。

shx 文件是可选的索引文件,因此非常简单,主要是大端。

Shapefile 是否已被工具、库或现有程序读取,但 shx 未被使用?您的解决方案是不使用它,或将其他工具指向它的存在。

这是从 shp 文件中读取记录的优化,因此不需要,或者可以通过解析 shapefile 重新创建。

但如果您确实需要它,则以二进制模式打开文件并将 2 字节大端值转换为偏移量和长度。

疯狂的字符来自阅读它,或将其显示为 ASCII,就像一张图片讲述一千个单词:

Hex Edit view of shp and shx file

查看第 96 行(十进制),左侧蓝色突出显示的是 shp 记录 0x000001 及其长度( 1 = 2字节)是0x0002c8,左边是shx索引,记录1的偏移是0x32,也就是50 2 字节对,因此文件中有 100 字节,记录长度同样为 0x2c80x590 字节。

疯狂字符是这些的ASCII表示,没有意义,这是十六进制数字右边的窄列,主要是.

注意 Record Info 是 Big endian,因此文件 2 字节 0x 00 00 27 0A 对应于 FILE CODE 的规范,9994 (十进制)。

shp 记录本身中的值,以及 header 中的边界框(前 100 个字节)是小端。

[在我最初进行编辑时交换了我的小端和大端]

关于python - 在 Ruby 中解析 ESRI 形状文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34029715/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com