gpt4 book ai didi

python - pandas python 中的嵌套循环

转载 作者:行者123 更新时间:2023-11-30 22:39:31 26 4
gpt4 key购买 nike

我有两个 DataFrame,一个有很多行,另一个有几行,我需要根据某些条件(以字符串形式)合并这两个 DataFrame。我在 Pandas 中使用了嵌套循环,如下所示:

density = []

for row in df.itertuples():
for row1 in df2.itertuples():
if(row['a'].find(row1['b']))>0:
density.append(row1['c'])

但我收到错误消息:

TypeError: tuple indices must be integers, not str

出了什么问题?

最佳答案

考虑dfdf2

df = pd.DataFrame(dict(
a=['abcd', 'stk', 'shij', 'dfffedeffj', 'abcdefghijk'],
))

df2 = pd.DataFrame(dict(
b=['abc', 'hij', 'def'],
c=[1, 2, 3]
))

您可以使用 get_valueset_value 产生不错的速度。我会将这些值存储在数据框中

density = pd.DataFrame(index=df.index, columns=df2.index)

for i in df.index:
for j in df2.index:
a = df.get_value(i, 'a')
b = df2.get_value(j, 'b')
if a.find(b) >= 0:
density.set_value(i, j, df2.get_value(j, 'c'))

print(density)

0 1 2
0 1 NaN NaN
1 NaN NaN NaN
2 NaN 2 NaN
3 NaN NaN 3
4 1 2 3

您还可以使用复合 numpy str 函数

t = df2.b.apply(lambda x: df.a.str.contains(x)).values

c = df2.c.values[:, None]

density = pd.DataFrame(
np.where(t, np.hstack([c] * t.shape[1]), np.nan).T,
df.index, df2.index)

关于python - pandas python 中的嵌套循环,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43150631/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com