gpt4 book ai didi

python - 在 Pandas Python 中连接字符串数据

转载 作者:行者123 更新时间:2023-11-30 22:12:10 25 4
gpt4 key购买 nike

晚上好,

快速一点,在数据框中连接字符串的最佳方法是什么?

我有一个 CSV,它是表单的输出。按照 if/else 形式,任何子问题的输出都已在新列中输出。

由于表单的大部分都是子问题,我想编写一个小脚本来执行以下操作。

1、删除不相关的列2. 通过分隔符连接剩余的列。 (',')3. 通过添加合并列和步骤 1 中的不相关列来创建新的 DF。

我的尝试:

import pandas as pd
import os
enter code here
df = pd.read_csv('survey.csv')

df
Qual, Qual2, Qual3, Qual4, Qual5, Qual6
0 IT Digital NaN NaN NaN NaN
1 NaN NaN Maths NaN NaN NaN

df['Combined_Data'] = df.fillna('').astype(str).sum(axis=1)

df:
Qual, Qual2, Qual3, Qual4, Qual5, Qual6 Combined Data
0 IT Digital NaN NaN NaN NaN ITDigital
1 NaN NaN Maths NaN Algebra NaN MathsAlgebra

我不确定如何在每个总和之间添加 , 或者实际上 sum 是否是执行此操作的正确方法..?可能不会。但这是我在多次谷歌搜索后发现的。

任何帮助将不胜感激。

最佳答案

使用applydropna :

df['Combined_Data'] = df.apply(lambda x: ', '.join(x.dropna()), axis=1)
print (df)
Qual, Qual2, Qual3, Qual4, Qual5, Qual6 Combined_Data
0 IT Digital NaN NaN NaN NaN IT, Digital
1 NaN NaN Maths NaN NaN Algebra Maths, Algebra

关于python - 在 Pandas Python 中连接字符串数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51190198/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com