gpt4 book ai didi

python - 如何删除每列中的重复字符?

转载 作者:太空宇宙 更新时间:2023-11-03 21:28:28 25 4
gpt4 key购买 nike

我使用了一个新的数据框df_all

         classA classB    year1 count1    docID1          year2   count2           doc2            
0 A8 B1 1972 1 0 1973 3 U015|U348|U768
1 A8 B2 1972 2 U157|U596 1973 0 0
2 A8 B3 1972 0 0 1973 1 U124

我已将 docID1 和 docID2 合并到新列中

df_all['all_doc']=df_all['docID1'].astype(str)+'|'+df_all['docID2'].astype(str)

classA classB year1 count1 docID1 year2 count2 doc2 all_doc
0 A8 B1 1972 1 0 1973 3 U015|U348|U768 ||U015|U348|U768
1 A8 B2 1972 2 U157|U596 1973 0 0 U157|U596|0
2 A8 B3 1972 0 0 1973 1 U124 ||U124

'all_doc'列中,它有重复的“|”在每一行中。我想知道如何删除重复的“|”在每一行

我希望看到这样的结果

|U015|U348|U768
|U124

提前谢谢

最佳答案

给定

>>> df = pd.DataFrame([['foo', '||U015|U348|U768'], ['bar', 'U157|U596|0'], ['baz', '||U124']], columns=['fiz', 'all_doc'])
>>> df
fiz all_doc
0 foo ||U015|U348|U768
1 bar U157|U596|0
2 baz ||U124

你可以发布

>>> df['all_doc'] = df['all_doc'].str.replace('\|+', '|')
>>> df
fiz all_doc
0 foo |U015|U348|U768
1 bar U157|U596|0
2 baz |U124

正则表达式\|+指定|字符的序列。每个序列都被单个 | 替换。

关于python - 如何删除每列中的重复字符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53694065/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com