gpt4 book ai didi

python - 通过迭代替换 Pandas DataFrame 中的数组值

转载 作者:太空宇宙 更新时间:2023-11-03 15:11:03 25 4
gpt4 key购买 nike

我正在使用 Pandas DataFrame,它在数组中具有一列条目,例如以下示例:

    user_id    tags
0 1 [a,b,c]
1 2 [a,b,d]
2 3 [b,c]
...
n n [a,d]

我有一些与 JSON 对象中的简化标签相关的标签 ID,并尝试使用以下方法用其非简化变体替换条目:

for user_tags in dataset['tags']:
for tag in user_tags:
for full_tag in UUIDtags['tags_full']:
if full_tag['id'] == tag:
tag = entry['name']

idname分别是JSON对象中对应的简化标签和完整标签名称。

但是,这不会改变执行时的值;我是否缺少替换这些值的 Pandas 方法?我担心我会替换整个数组而不是替换单个条目。

谢谢!

编辑:JSON 对象 (UUIDtags) 包含内容的示例。

{
"tags_full": [{
"id": "a",
"name": "Alpha"
}, {
"id": "b",
"name": "Beta"
....

最佳答案

创建示例数据。

>>> df = pd.DataFrame({'tags':[list(['a', 'b', 'c']), 
list(['a', 'b', 'd']), list(['b', 'c'])], 'user_id': [i for i in range(1,4)]})

>>> df
tags user_id
0 [a, b, c] 1
1 [a, b, d] 2
2 [b, c] 3

生成一个替换字典,其中字母作为键,完整标签作为值。

>>> replace_dict = {'a': 'Alpha', 'b': 'Beta', 'Charlie': 'c', 'Delta': 'd'}

好吧,回到解决方案...对行和每行中的字母进行迭代,并使用 replacement_dict 中的相应值进行替换。

>>> for row in range(len(df)):
... for tag in range(len(df.loc[row, 'tags'])):
... df.loc[row, 'tags'][tag] = replace_dict[df.loc[row, 'tags'][tag]]
...

这是结果。

>>> df
tags user_id
0 [Alpha, Beta, Charlie] 1
1 [Alpha, Beta, Delta] 2
2 [Beta, Charlie] 3
<小时/>

旁注:replacement_dict 的创建是根据示例数据中出现的字母临时创建的替换字典。为了为您的完整数据生成这样一个替换字典,您可以这样做。

例如,假设 UUIDtags 是完整的 JSON 对象

>>> UUIDtags = {'tags_full': [{'id':'a', 'name':'Alpha'}, {'id':'b', 'name':'Beta'}]}

我们可以生成这样的替换字典

>>> uuidtags_dict = {}
>>> for tag in UUIDtags['tags_full']:
... uuidtags_dict[tag['id']] = tag['name']
...
>>> uuidtags_dict
{'a': 'Alpha', 'b': 'Beta'}

这代替换字典将根据您在编辑中提供的示例扩展到整个 JSON 对象。

关于python - 通过迭代替换 Pandas DataFrame 中的数组值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44208930/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com