python - read_table pandas python 数字错误-6ren

python - read_table pandas python 数字错误

转载作者：行者123 更新时间：2023-11-30 23:38:52

25

4

我正在对 .txt 文件执行基本的 pd.read_table 操作。第一列是尖点列表。 cusip "65248E10" 被读取为数字 65248E10 = 652480000000000(E10 作为科学记数法)。

我一直在研究 Pandas ，但我不知道如何要求它保持作为一个角色。 http://pandas.pydata.org/pandas-docs/dev/generated/pandas.io.parsers.read_table.html#pandas.io.parsers.read_table

此外，即使我设置 header = 0，它似乎也将第一行作为标题，然后第 0 行作为第二行，依此类推。如果我的文本文件没有列名，如何将其默认为 NULL(或 1、2、3 等)

感谢您的帮助。我是 pandas/python 的新手

最佳答案

如果我们有一个如下所示的数据文件

65248E10 11
55555E55 22

然后我们可以用类似的方式读取它

>>> pd.read_table("cusip.txt", header=None, delimiter=" ", converters={0: str})
          0   1
0  65248E10  11
1  55555E55  22

我们使用 header=None 告诉它没有任何 header ，我们使用 delimiter="" 告诉它有一个空格分隔符(调整为匹配您的数据格式)，并 converters={0: str} 告诉它在将第一列读取为字符串后，我们希望将其转换为字符串(即在本例中不执行任何操作)到它)而不是进一步处理它。除了 converters={0: str}，dtype=(str, int) 也可以工作，但这样我们仍然可以让 pandas > 弄清楚其他列是什么。

使用header=0的问题是这里的0并不意味着“无标题”，它意味着使用行号#0(第一行)作为标题。

关于python - read_table pandas python 数字错误，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/14060111/

25

4

0

文章推荐： python - 结构打包/拆包类设计

文章推荐： python - 如何使用PyQt4点击网页上 'alert'消息中的按钮

文章推荐： python - Mechanize:提交表单但不加载新页面以查看结果

文章推荐： python - 每个文档中 ISODate 之间的差异？

带有续行的 Python Pandas read_table
pandas 是否可以读取包含续行的文本文件？例如，假设我有一个文本文件“read_table.txt”，它看起来像这样: col1, col2 a, a string b, a very long
python - Pandas read_table 多行列
我正在使用文本文件 (ClassTest.txt) 和 pandas。该文本文件有 3 个制表符分隔的列:标题、说明和类别 - 标题和说明是普通字符串，类别是(非零)整数。我收集的数据如下: dat
python - pandas 中的并行 read_table
有没有办法并行调用 read_table()？就我而言，由于日期解析，它受到 CPU 限制。我看不出有什么方法可以通过阅读文档来实现这一目标。唯一想到的是分割输入文件，并行调用 read_table，
python - Pandas read_table() 有大小限制吗？
假设我有一个 .dat 文件，filename.dat，我希望将其读入 Pandas Dataframe: import pandas as pd df = pd.read_table('filena
python - Pandas read_table() 缺少行
Pandas read_table 函数在我尝试读取的文件中缺少一些行，但我无法找出原因。 import pandas as pd import numpy as np filename = "wha
python - pandas read_table 中的行索引
我正在将以下数组读入 pandas 数据帧: 1 0.140000 0.180000 0.200000 2 0.240000 0.320000 0.320000 3 0.340000 0.430000
python - Pandas read_table 错误
我正在尝试将制表符分隔的文本文件读取到数据框中。这是文件在 Excel 中的样子: CALENDAR_DATE ORDER_NUMBER INVOICE_NUMBER TRANSACTI
python pandas 日期 read_table
我有以下输入文件: 2012,10,3,AAPL,BUY,200 2012,12,5,AAPL,SELL,200 如何将其读入具有以下列的 pandas 数据框: index: default int
python - Pandas read_table 使用第一列作为索引
我这里有个小问题。我有一个 txt 文件，其中包含以下形式的行(比方说第 1 行): id1-a1-b1-c1 我想使用 pandas 将其加载到数据框中，索引为 id，列名称为“A”、“B”、“C”
python - read_table pandas python 数字错误
我正在对 .txt 文件执行基本的 pd.read_table 操作。第一列是尖点列表。 cusip "65248E10" 被读取为数字 65248E10 = 652480000000000(E10
python - 使用 Pandas read_table 和文件列表
总的来说，我对 Python 还很陌生，但我正在尝试制作一个脚本，从文件夹中的某些文件中获取数据并将其放入 Excel 电子表格中。我的代码将在指定的文件夹中找到我想要的文件类型，然后创建包含完整文
python - 带有正则表达式定界符的 pandas read_table，因为负数没有中间空格
我正在尝试使用 read_table 函数将空格分隔的表格(下面的示例)读取到 pandas 数据框中。 1 0.00000E+00-7.52896E-04 0.00000E+00 0.00000E
python - 设置 pandas.read_table 字段和记录分隔符
我正在尝试读取一个文件，该文件在一行中使用两个冒号 (::) 来分隔字段，并使用管道来分隔记录。因此，数据文件 test.txt 可能如下所示: testcol1::testcol2|testdata
python-3.x - 具有重复名称的 Pandas read_table
在指定重复列名的同时读取表格时 - 假设有两个不同的名称 - pandas 0.16.1 将一遍又一遍地复制数据的最后两列。 In [1]: df = pd.read_table('Dataset
python - Pandas read_table 使用 MultiIndex 跳过行
我正在尝试使用 pandas read_table 读取 tsv 文件，但由于某种原因，第一行已从文件中删除。 test.pln(文件为here): Class index 0 0 0 1
python - ":"的 pandas read_table usecols 错误
我正在尝试使用 python pandas read_table 函数从我的文件中读取一定范围的非连续列。为此，我正在尝试: df=pd.read_table('genes.fpkm_tracking
python - 强制日期时间转换，强制日期时间数据类型，使用 pandas 中的 read_table
我的数据有两个以天为单位的日期字段，但在数千万行中，某些行存在错误。为了速度和内存限制，我宁愿在读入数据后立即将列转换为日期时间，但我似乎无法强制该过程离开 NaT对于无效的字符串而不是引发错误。我可
python - Pandas read_table() 数千 =',' 不工作
我正在尝试读取一些人口数据作为学习 pandas 的练习: >>> countries = pd.read_table('country_data.txt',
python - 如何将 pd.read_table 与 StringIO 文件对象一起使用？
我 checkout read_table with stringIO and messy file但它有一些我无法复制的东西，比如这个原始对象。无论如何，我想将一个表写入 StringIO 文件对象
python - pandas read_table 中的 usecols 结果为 "list index out of range"
我想在用 pandas 解析一些数据时只选择 2 列。 pd.read_table的帮助提到了一个usecols选项，这似乎正是我想要的: usecols : array-like, default

首页

博学

6Ren·AI

商城

python - read_table pandas python 数字错误