gpt4 book ai didi

python - 分区(如果适用)

转载 作者:太空宇宙 更新时间:2023-11-04 02:03:56 31 4
gpt4 key购买 nike

我在数据框中有一列,其中包含大约 1,4M 行聊天对话,其中每个单元格中的一般格式为 (1):

名称代理 : 对话

但是,并非列中的所有单元格都采用这种格式。有些单元格只是 (2):

对话

我使用以下代码仅获取结构类似于 (1) 的单元格的对话:

only_transcripts['msgText'] = only_transcripts['msgText'].str.partition(':', expand = True)[2]

但是,如果单元格不包含冒号 (:),显然这段代码不返回任何内容。

有没有一种快速的方法,我可以避免 for 循环遍历每个实例,只在包含冒号的单元格中应用上面的代码?

最佳答案

添加Series.fillna通过原始列替换NaN,这里还有另一种解决方案,通过split和seelct second lists by indexing

only_transcripts['msgText'] =(only_transcripts['msgText'].str.split(':')
.str[1]
.fillna(only_transcripts['msgText']))

关于python - 分区(如果适用),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55122982/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com