gpt4 book ai didi

python - 随机化两个 csv 文件,但索引顺序相同

转载 作者:行者123 更新时间:2023-12-05 04:38:43 25 4
gpt4 key购买 nike

我有两个 csv 文件,其中包含多列文本。它们都有相同的文本,但使用不同的语言。因此,例如 csv1 看起来像:

header1               header2
How are you Good
What day is it Friday
Whats your name Mary

csv2 将是:

header1               header2
Qué tal estás Bien
Qué dia es Viernes
Cómo te llamas María

现在我想将它们随机化,但我需要翻译仍保持相同的顺序。换句话说,我需要索引的顺序相同:如果索引 1 随机化为 csv1 中的最后一个,我希望 csv2 也相同:

header1               header2
What day is it Friday
Whats your name Mary
How are you Good


header1 header2
Qué dia es Viernes
Cómo te llamas María
Qué tal estás Bien

这是我所做的:

import pandas as pd

df = pd.read_csv('train.csv')

data = df.sample(frac=1)

然而,对于这段代码,两个 csv 文件最终都有不同的顺序。有没有办法随机化文件但固定索引的顺序?

如果有什么地方没有得到很好的解释,我深表歉意,这是我第一次接触这个网站和编码。

最佳答案

df1_shuff = df1.sample(frac=1)
df2_shuff = df2.reindex(df1_shuff.index)

假设两个 df 以相同的常规 RangeIndex 开始(您在执行 pd.read_csv() 时得到的作为OP 确实如此),然后两个 df_shuff 都以相同的方式洗牌。

我要补充的是,在 OP 代码之后唯一需要的附加行是(假设另一个 df 被命名为 df2,但根据需要替换):

data2 = df2.resample(data.index)

关于python - 随机化两个 csv 文件,但索引顺序相同,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/70541503/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com