gpt4 book ai didi

python - 如何创建具有重复字符串值的数据框列?

转载 作者:太空宇宙 更新时间:2023-11-03 10:59:32 25 4
gpt4 key购买 nike

我正在从一堆文件中读取数据并将其存储在数据框中。我想要数据框的一列来指示数据来自哪个文件。如何创建一个具有相同字符串的列,而无需手动输入?

我正在阅读的每个文件都有大约 100 个数据点(但每次的数量都不相同)。当我读入每一个时,我将沿着 axis=0 连接到数据框。它应该看起来像这样。

import numpy as np
import pandas as pd
numbers = np.random.randn(5) # this data could be of any length, ~100
labels = np.array(['file01','file01','file01','file01','file01'])
tf = pd.DataFrame()
tf['labels'] = labels
tf['numbers'] = numbers

In [8]: tf
Out[8]:
labels numbers
0 file01 -0.176737
1 file01 -1.243871
2 file01 0.154886
3 file01 0.236653
4 file01 -0.195053

(是的,我知道我可以将“file01”设为列标题并沿 axis=1 附加每个列,但出于某些原因我不想那样做。)

最佳答案

好了,您的代码已修复!实际上,您可以在 DataFrame 构造函数中使用的字典中放入单个值 :)。

import numpy as np
import pandas as pd
filename = 'file01'
numbers = np.random.randn(5) # this data could be of any length, ~100
tf = pd.DataFrame({'labels': filename , 'numbers': numbers})

In [8]: tf
Out[8]:
labels numbers
0 file01 -0.176737
1 file01 -1.243871
2 file01 0.154886
3 file01 0.236653
4 file01 -0.195053

关于python - 如何创建具有重复字符串值的数据框列?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35557872/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com