gpt4 book ai didi

python - 如何填充 pandas 中缺失的 GPS 数据?

转载 作者:行者123 更新时间:2023-12-01 07:10:25 25 4
gpt4 key购买 nike

我有一个看起来像这样的数据框

+-----+------------+-------------+-------------------------+----+----------+----------+
| | Actual_Lat | Actual_Long | Time | ID | Cal_long | Cal_lat |
+-----+------------+-------------+-------------------------+----+----------+----------+
| 0 | 63.433376 | 10.397068 | 2019-09-30 04:48:13.540 | 11 | 10.39729 | 63.43338 |
| 1 | 63.433301 | 10.395846 | 2019-09-30 04:48:18.470 | 11 | 10.39731 | 63.43326 |
| 2 | 63.433259 | 10.394543 | 2019-09-30 04:48:23.450 | 11 | 10.39576 | 63.43323 |
| 3 | 63.433258 | 10.394244 | 2019-09-30 04:48:29.500 | 11 | 10.39555 | 63.43436 |
| 4 | 63.433258 | 10.394215 | 2019-09-30 04:48:35.683 | 11 | 10.39505 | 63.43427 |
| ... | ... | ... | ... | ...| ... | ... |
| 70 | NaN | NaN | NaT | NaN| 10.35826 | 63.43149 |
| 71 | NaN | NaN | NaT | NaN| 10.35809 | 63.43155 |
| 72 | NaN | NaN | NaT | NaN| 10.35772 | 63.43163 |
| 73 | NaN | NaN | NaT | NaN| 10.35646 | 63.43182 |
| 74 | NaN | NaN | NaT | NaN| 10.35536 | 63.43196 |
+-----+------------+-------------+-------------------------+----------+----------+----------+

Actual_latActual_long 包含从 GPS 设备获取的数据的 GPS 坐标。 Cal_latcal_lat 是从 OSRM 的 API 获取的 GPS 坐标。正如您所看到的,实际坐标中缺少大量数据。我希望获得一个数据集,这样当我获取actual_lat 与cal_lat 的差异时,它应该为零或至少接近于零。我尝试用目的地纬度和经度来填充这些缺失值,但这会导致巨大的差异。我的问题是如何使用 python/pandas 填充这些值,以便当车辆遵循 OSRM 估计路径时,实际纬度/经度和估计纬度/经度之间的差异应为零或接近于零。我是 GIS 数据集的新手,不知道如何处理它们。

编辑:我正在寻找这样的东西。


+-----+------------+-------------+-------------------------+----------+----------+----------+----------------------+----------------------+
| | Actual_Lat | Actual_Long | Time | Tour ID | Cal_long | Cal_lat | coordinates_diff_Lat | coordinates_diff_Lon |
+-----+------------+-------------+-------------------------+----------+----------+----------+----------------------+----------------------+
| 0 | 63.433376 | 10.397068 | 2019-09-30 04:48:13.540 | 11 | 10.39729 | 63.43338 | -0.000 | -0.000 |
| 1 | 63.433301 | 10.395846 | 2019-09-30 04:48:18.470 | 11 | 10.39731 | 63.43326 | 0.000 | -0.001 |
| 2 | 63.433259 | 10.394543 | 2019-09-30 04:48:23.450 | 11 | 10.39576 | 63.43323 | 0.000 | -0.001 |
| 3 | 63.433258 | 10.394244 | 2019-09-30 04:48:29.500 | 11 | 10.39555 | 63.43436 | -0.001 | -0.001 |
| 4 | 63.433258 | 10.394215 | 2019-09-30 04:48:35.683 | 11 | 10.39505 | 63.43427 | -0.001 | -0.001 |
| ... | ... | ... | ... | ... | ... | ... | ... | ... |
| 70 | 63.43000 | 10.35800 | NaT | 115268.0 | 10.35826 | 63.43149 | 0.000 | -0.003 |
| 71 | 63.43025 | 10.35888 | NaT | 115268.0 | 10.35809 | 63.43155 | 0.000 | -0.003 |
| 72 | 63.43052 | 10.35713 | NaT | 115268.0 | 10.35772 | 63.43163 | 0.000 | -0.002 |
| 73 | 63.43159 | 10.35633 | NaT | 115268.0 | 10.35646 | 63.43182 | 0.000 | -0.001 |
| 74 | 63.43197 | 10.35537 | NaT | 115268.0 | 10.35536 | 63.43196 | 0.000 | 0.000 |
+-----+------------+-------------+-------------------------+----------+----------+----------+----------------------+----------------------+

请注意,63.43197,10.35537 是目的地,63.433376,10.397068 是起始位置。所有这些点代表道路坐标。

最佳答案

IIUC,你需要这样的东西:

我将从 df 中取出列作为列表。

div = float(len(cal_lat)) / float(len(actual_lat))

new_l = []
for i in range(len(cal_lat)):
new_l.append(actual_lat[int(i/div)])

print(new_l)
len(new_l)

对经度列执行同样的操作。由于这些是 GPS 点,因此在计算差异时,您可以调整模型,使其精度高达 3 位数。因此,请记住这一点,从 Actual_lat 和 lng 开始,如果您的下一个值与第一个值相同,则差异不会太大。希望我说得有道理,并且您也有自己的解决方案。

关于python - 如何填充 pandas 中缺失的 GPS 数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58251177/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com