gpt4 book ai didi

Python 跨数据帧匹配项目

转载 作者:太空宇宙 更新时间:2023-11-03 15:33:41 26 4
gpt4 key购买 nike

我发现很多问题,人们都在寻找匹配列表中的项目,但我的问题略有不同,导致了一些麻烦。我在 Windows 7 机器上使用 Python 3.6。

假设我是一家杂货店链式店的首席执行官,每周我都会收到一个 Excel 文件,其中包含每个商店每个商品的库存量。其中有 2 列,第一列是商店的城市和商品名称,第二列是商品数量。每个项目之前都有 4 个空格,而城市则没有空格,但两者位于同一列中。

|New York   |NAN|
| Apples |10 |
| Oranges |20 |
| Pears |30 |
|Los Angeles|NAN|
| Apples |20 |
| Oranges |40 |
|Dallas |NAN|
| Apples |30 |
| Oranges |60 |
| Pears |90 |

需要每周将其上传到服务器一次以进行库存控制。我在 pandas 数据框中对与每个商店和商品相关的 SKU 进行了交叉引用。

困难的部分来了。我现在想将其与我的 SKU 相匹配,以便我可以正确获取每个商店的每个 SKU 的库存。我的库存数据框是:

|City|Item     |#|
|NY | Apples |?|
|NY | Oranges |?|
|NY | Pears |?|
|LA | Apples |?|

我的想法是首先在列表中查找纽约,一旦找到纽约,就逐行向下迭代,直到找到我的水果。问题如图所示,洛杉矶没有 Pears,如果纽约用完,该行就会丢失,而不仅仅是库存为 0。因此,for 循环将迭代,直到到达达拉斯并使用其库存,而不是返回纽约没有梨。简而言之,如何确保 for 循环不会越过我试图获取并返回不同城市库存的城市?

最佳答案

不要直接将数据加载到 pandas 中,而是使用 xlrd 解析 Excel 文件。使用正确的城市重新格式化文件产品 |计算条目并将其提取到数据帧中。然后,您应该能够使用标准 pandas.DataFrame.merge 对照 SKU 交叉引用此列表。

关于Python 跨数据帧匹配项目,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42707248/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com