python - Pandas 返回 "Passed header names mismatches usecols"错误-6ren

python - Pandas 返回 "Passed header names mismatches usecols"错误

转载作者：太空宇宙更新时间：2023-11-03 13:41:03

28

4

以下按预期工作。 190栏全部读入。

pd.read_csv("data.csv", 
             header=None,
             names=columns,
             # usecols=columns[:10], 
             nrows=10
             )

我以前使用过 usecols 参数，所以我很困惑为什么它不再对我有用。我猜想简单地将前 10 个列名切片就可以了，但我继续收到“传递的 header 名称与 usecols 不匹配”错误。

我正在使用 Pandas 0.16.2。

pd.read_csv("data.csv", 
             header=None,
             names=columns,
             usecols=columns[:10], 
             nrows=10
             )

回溯

---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-44> in <module>()
      3                     nrows=10,
      4                     header=None,
----> 5                     names=columns,
      6                     )

/.../lib/python2.7/site-packages/pandas/io/parsers.pyc in parser_f(filepath_or_buffer, sep, dialect, compression, doublequote, escapechar, quotechar, quoting, skipinitialspace, lineterminator, header, index_col, names, prefix, skiprows, skipfooter, skip_footer, na_values, na_fvalues, true_values, false_values, delimiter, converters, dtype, usecols, engine, delim_whitespace, as_recarray, na_filter, compact_ints, use_unsigned, low_memory, buffer_lines, warn_bad_lines, error_bad_lines, keep_default_na, thousands, comment, decimal, parse_dates, keep_date_col, dayfirst, date_parser, memory_map, float_precision, nrows, iterator, chunksize, verbose, encoding, squeeze, mangle_dupe_cols, tupleize_cols, infer_datetime_format, skip_blank_lines)
    472                     skip_blank_lines=skip_blank_lines)
    473 
--> 474         return _read(filepath_or_buffer, kwds)
    475 
    476     parser_f.__name__ = name

/.../lib/python2.7/site-packages/pandas/io/parsers.pyc in _read(filepath_or_buffer, kwds)
    248 
    249     # Create the parser.
--> 250     parser = TextFileReader(filepath_or_buffer, **kwds)
    251 
    252     if (nrows is not None) and (chunksize is not None):

/.../lib/python2.7/site-packages/pandas/io/parsers.pyc in __init__(self, f, engine, **kwds)
    564             self.options['has_index_names'] = kwds['has_index_names']
    565 
--> 566         self._make_engine(self.engine)
    567 
    568     def _get_options_with_defaults(self, engine):

/.../m9tn/lib/python2.7/site-packages/pandas/io/parsers.pyc in _make_engine(self, engine)
    703     def _make_engine(self, engine='c'):
    704         if engine == 'c':
--> 705             self._engine = CParserWrapper(self.f, **self.options)
    706         else:
    707             if engine == 'python':

/.../lib/python2.7/site-packages/pandas/io/parsers.pyc in __init__(self, src, **kwds)
   1070         kwds['allow_leading_cols'] = self.index_col is not False
   1071 
-> 1072         self._reader = _parser.TextReader(src, **kwds)
   1073 
   1074         # XXX

pandas/parser.pyx in pandas.parser.TextReader.__cinit__ (pandas/parser.c:4732)()

pandas/parser.pyx in pandas.parser.TextReader._get_header (pandas/parser.c:7330)()

ValueError: Passed header names mismatches usecols

最佳答案

原来数据集中有 191 列(不是 190)。 Pandas 自动将我的第一列数据设置为索引。我不太清楚为什么会导致它出错，因为 usecols 中的所有列实际上都存在于已解析的数据集中。

因此，解决方案是确认名称中的列数与数据集中的列数完全对应。

另外，我找到了this GitHub 上的讨论。

关于python - Pandas 返回 "Passed header names mismatches usecols"错误，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31017823/

28

4

0

文章推荐： iOS - 如何限制特定用户在不同设备上的应用程序安装

文章推荐： Android KeyStore.getInstance ("RSA") 不工作

文章推荐： .htaccess - 仅一页的 HTTPS

python - 忽略 'usecol' 参数中的缺失列
我正在从 csv 读取一个表，并且只想要列的一个子集。我用于子集的列表包含我正在阅读的表中可能不存在的字段名称。例如: # contents of sample.csv: #a,b,c #1,2,3
Python 在使用 Usecol 时添加列
我希望这很容易完成，但我遇到了问题，因为我从文本文件中选择列，但也想将文件名的一部分添加为最后一列或第四列。当然，我收到了“预期轴”的错误。下面是我的代码: import pandas as pd
python - Pandas usecols 除了最后一个
我有一个 csv 文件，是否可以让 usecols 在使用 read_csv 时获取除最后一列之外的所有列，而不列出所需的每一列。例如，如果我有一个 13 列的文件，我可以执行 usecols=[0
python - usecols 在 pandas 中不区分大小写
我正在尝试循环浏览大量具有相同列名的 CSV，但其中一些具有不同的大小写。我在我的代码中使用“usecols”，当大小写与 mycols 列表不匹配时会抛出错误。 df=pd.read_csv(fn
python - Pandas read_csv usecols 和名称无法正常工作
我正在 pandas 中读取一个没有标题的 csv 文件。我的问题是，当我在 usecols 中硬编码值并命名时，它工作正常。但是，当我从 cols 和名称列表获取输入(这些列表从 json 文件作为
python - Pandas read_csv usecols 和名称无法正常工作
我正在 pandas 中读取一个没有标题的 csv 文件。我的问题是，当我在 usecols 中硬编码值并命名时，它工作正常。但是，当我从 cols 和名称列表获取输入(这些列表从 json 文件作为
python - usecols 与 parse_dates 和名称
我正在尝试以下列格式加载包含 OHLC 数据的 csv 文件。 In [49]: !head '500008.csv' 03 Jan 2000,12.85,13.11,12.74,13.11,9765
python - 即使使用 usecols， Pandas 也会读取整个文件吗？
我正在使用 pandas 读取休息服务中的文件。该文件很大，有 100 多列。但我只想阅读前两列。我知道我可以在 read_csv 中使用 usecols 但我想知道它究竟是如何工作的？ pandas
python - Pandas read_csv usecols 相同的索引
考虑以下代码: import pandas as pd from StringIO import StringIO x=''' a,b,c,d 1,2,3,4 5,6,7,8 9,10,11,12 1
python - Pandas read_csv usecols 接受不存在的列名
是否可以制作 Pandas 。 read_csv()如果在输入文件中找不到 usecols 中指定的列，则会引发错误？例如。在下面的示例中，我希望 Pandas 引发异常，因为输入文件中没有名为“he
python - Pandas : Usecols do not match columns, 列预期但未找到
我收到一个错误: ValueError: Usecols do not match columns, columns expected but not found: ['Search Query']
python - 使用 usecols 时 Pandas 保留索引列
这是我的问题的重新措辞版本，希望更有意义: 当使用带有隐式索引的 read_csv 时(即文件中的第一列没有标题)，一切正常，我得到一个数据帧，其索引是文件中的第一列 -隐式索引列。但是，如果我将
python - ":"的 pandas read_table usecols 错误
我正在尝试使用 python pandas read_table 函数从我的文件中读取一定范围的非连续列。为此，我正在尝试: df=pd.read_table('genes.fpkm_tracking
python - pandas read_csv 和使用 usecols 过滤列
当我使用 usecols 过滤列并使用多个索引时，pandas.read_csv 无法正确输入 csv 文件。 import pandas as pd csv = r"""dummy,date,loc
python - 使用 usecols 时 pandas.read_excel 错误
我在从 Excel 文件读取数据时遇到一些问题。Excel 文件包含带有 unicode 字符的列名称。由于一些自动化原因，我需要将 usecols 参数传递给 pandas.read_excel
python - Pandas- ValueError : Usecols do not match columns, 列预期但未找到
我正在尝试将一些列从导入的 csv 文件复制到 selected.csv 但它给了我这个错误: 'ValueError: Usecols do not match columns, columns e
python - 在 Pandas Read_CSV 中使用 UseCols 时按指定顺序保留列
我有一个包含 50 列数据的 csv 文件。我正在使用 Pandas read_csv 函数提取这些列的子集，使用 usecols 参数来选择我想要的列: cols_to_use = [0,1,5,1
python - 选择 usecols 参数将 Excel 文件导入 Pandas 时出错
我正在尝试将数据从 Excel 文件导入 pandas，但在输入以下内容时出现错误: energy = pd.read_excel('Indicators.xls',
python - pandas read_table 中的 usecols 结果为 "list index out of range"
我想在用 pandas 解析一些数据时只选择 2 列。 pd.read_table的帮助提到了一个usecols选项，这似乎正是我想要的: usecols : array-like, default
python - Pandas 返回 "Passed header names mismatches usecols"错误
以下按预期工作。 190栏全部读入。 pd.read_csv("data.csv", header=None, names=columns,

首页

博学

6Ren·AI

商城

python - Pandas 返回 "Passed header names mismatches usecols"错误