gpt4 book ai didi

python - 通过组合文本 Pandas 制作新的数据框

转载 作者:可可西里 更新时间:2023-11-01 14:45:09 24 4
gpt4 key购买 nike

我有一个 pandas 数据框,其结构如下:

ID TEXT
1 Start of document
1 middle
1 end of document
2 start of document 2
2 middle
2 end of document 2

我得到的原始数据有重复的 ID,如果您将每个唯一 ID 的文本连接起来,您将得到一个结果文档。其中一些 ID 重复数百次导致大量文本,我想将其归结为一个观察结果。

我不确定如何循环遍历并创建新文档。也不确定 Pandas 是否是存储大量文本的正确数据结构(这些是转录的通话记录——其中一些超过 30 分钟的对话)。将不胜感激任何指针。

最佳答案

IIUC:

df.groupby('ID').TEXT.apply(' '.join)

ID
1 Start of document middle end of document
2 start of document 2 middle end of document 2
Name: TEXT, dtype: object

关于python - 通过组合文本 Pandas 制作新的数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52449689/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com