gpt4 book ai didi

python - 数据读取-csv

转载 作者:行者123 更新时间:2023-11-28 21:43:25 25 4
gpt4 key购买 nike

我在 .dfx 文件中有一些数据,我试图用 pandas 将其读取为 csv。但它有一些特殊字符, Pandas 无法阅读。它们也是分隔符。 I attached one line from it

当我打印文件时,“DC4”被删除了。 SI 被正确地读作空格。我尝试了一些编码(utf-8、latin1 等),但没有成功。 I attached the printed first line as well. I marked the place where the characters should be.

我的代码很简单:

import pandas

file_log = pandas.read_csv("file_log.DFX", header=None)

print(file_log)

我希望我说的很清楚并且有人有想法。提前致谢!

编辑:

输入。链接:drive.google.com/open?id=0BxMDhep-LHOIVGcybmsya2JVM28

预期输出:

88.4373 0 12.07.2014/17:05:22 38.0366  38.5179 1.3448 31.9839
30.0070 0 12.07.2014/17:14:27 38.0084 38.5091 0.0056 0.0033

最佳答案

通过检查十六进制的 example.DFX(使用 xxd),两个分隔符相应地为 0x140x0f

使用 python 引擎读取带有多个分隔符的 csv:

import pandas

sep1 = chr(0x14) # the one shows dc4
sep2 = chr(0x0f) # the one shows si
file_log = pandas.read_csv('example.DFX', header=None, sep='{}|{}'.format(sep1, sep2), engine='python')

print file_log

你得到:

         0  1                    2        3        4       5        6   7
0 88.4373 0 12.07.2014/17:05:22 38.0366 38.5179 1.3448 31.9839 NaN
1 30.0070 0 12.07.2014/17:14:27 38.0084 38.5091 0.0056 0.0033 NaN

它的末尾似乎有一个空列。但我相信你能处理好。

关于python - 数据读取-csv,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42283189/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com