- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我有一个包含 50 列数据的 csv 文件。我正在使用 Pandas read_csv 函数提取这些列的子集,使用 usecols 参数来选择我想要的列:
cols_to_use = [0,1,5,16,8]
df_ret = pd.read_csv(filepath, index_col=False, usecols=cols_to_use)
问题是 df_ret 包含正确的列,但不是按照我指定的顺序。它们按升序排列,因此 [0,1,5,8,16]。 (顺便说一句,列号可以在每次运行时改变,这只是一个例子。)这是一个问题,因为代码的其余部分具有“正确”顺序的数组,我宁愿不必重新排序所有他们中的。
是否有任何聪明的 pandas 方法可以按照指定的顺序拉入列?任何帮助将不胜感激!
最佳答案
您可以重复使用相同的 cols_to_use
列表来按所需顺序选择列:
df_ret = pd.read_csv(filepath, index_col=False, usecols=cols_to_use)[cols_to_use]
关于python - 在 Pandas Read_CSV 中使用 UseCols 时按指定顺序保留列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40024406/
我正在从 csv 读取一个表,并且只想要列的一个子集。我用于子集的列表包含我正在阅读的表中可能不存在的字段名称。例如: # contents of sample.csv: #a,b,c #1,2,3
我希望这很容易完成,但我遇到了问题,因为我从文本文件中选择列,但也想将文件名的一部分添加为最后一列或第四列。当然,我收到了“预期轴”的错误。 下面是我的代码: import pandas as pd
我有一个 csv 文件,是否可以让 usecols 在使用 read_csv 时获取除最后一列之外的所有列,而不列出所需的每一列。 例如,如果我有一个 13 列的文件,我可以执行 usecols=[0
我正在尝试循环浏览大量具有相同列名的 CSV,但其中一些具有不同的大小写。 我在我的代码中使用“usecols”,当大小写与 mycols 列表不匹配时会抛出错误。 df=pd.read_csv(fn
我正在 pandas 中读取一个没有标题的 csv 文件。我的问题是,当我在 usecols 中硬编码值并命名时,它工作正常。但是,当我从 cols 和名称列表获取输入(这些列表从 json 文件作为
我正在 pandas 中读取一个没有标题的 csv 文件。我的问题是,当我在 usecols 中硬编码值并命名时,它工作正常。但是,当我从 cols 和名称列表获取输入(这些列表从 json 文件作为
我正在尝试以下列格式加载包含 OHLC 数据的 csv 文件。 In [49]: !head '500008.csv' 03 Jan 2000,12.85,13.11,12.74,13.11,9765
我正在使用 pandas 读取休息服务中的文件。该文件很大,有 100 多列。但我只想阅读前两列。我知道我可以在 read_csv 中使用 usecols 但我想知道它究竟是如何工作的? pandas
考虑以下代码: import pandas as pd from StringIO import StringIO x=''' a,b,c,d 1,2,3,4 5,6,7,8 9,10,11,12 1
是否可以制作 Pandas 。 read_csv()如果在输入文件中找不到 usecols 中指定的列,则会引发错误?例如。在下面的示例中,我希望 Pandas 引发异常,因为输入文件中没有名为“he
我收到一个错误: ValueError: Usecols do not match columns, columns expected but not found: ['Search Query']
这是我的问题的重新措辞版本,希望更有意义: 当使用带有隐式索引的 read_csv 时(即文件中的第一列没有标题),一切正常,我得到一个数据帧,其索引是文件中的第一列 -隐式索引列。 但是,如果我将
我正在尝试使用 python pandas read_table 函数从我的文件中读取一定范围的非连续列。为此,我正在尝试: df=pd.read_table('genes.fpkm_tracking
当我使用 usecols 过滤列并使用多个索引时,pandas.read_csv 无法正确输入 csv 文件。 import pandas as pd csv = r"""dummy,date,loc
我在从 Excel 文件读取数据时遇到一些问题。Excel 文件包含带有 unicode 字符的列名称。 由于一些自动化原因,我需要将 usecols 参数传递给 pandas.read_excel
我正在尝试将一些列从导入的 csv 文件复制到 selected.csv 但它给了我这个错误: 'ValueError: Usecols do not match columns, columns e
我有一个包含 50 列数据的 csv 文件。我正在使用 Pandas read_csv 函数提取这些列的子集,使用 usecols 参数来选择我想要的列: cols_to_use = [0,1,5,1
我正在尝试将数据从 Excel 文件导入 pandas,但在输入以下内容时出现错误: energy = pd.read_excel('Indicators.xls',
我想在用 pandas 解析一些数据时只选择 2 列。 pd.read_table的帮助提到了一个usecols选项,这似乎正是我想要的: usecols : array-like, default
以下按预期工作。 190栏全部读入。 pd.read_csv("data.csv", header=None, names=columns,
我是一名优秀的程序员,十分优秀!