作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个看起来像这样的文本文件:
`
101 the 323
103 to 324
104 is 325
其中分隔符是四个空格。我正在尝试 read_csv
函数,以便将其转换为 pandas 数据框。
data= pd.read_csv('file.txt', sep=" ", header = None)
但是它给了我很多 NaN 值
101\tthe\tthe\t10115 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN
102\tto\tto\t5491 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN
103\tof\tof\t4767 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN
104\ta\ta\t4532 NaN NaN NaN NaN NaN NaN NaN NaN NaN Na
有什么方法可以将文本文件读取为正确的 csv 格式。
最佳答案
如果需要分隔符正好 4
个空格:
data = pd.read_csv('file.txt', sep="\s{4}", header = None, engine='python')
print (data)
0 1 2
0 101 the 323
1 103 to 324
2 104 is 325
或者使用参数 delim_whitespace=True
(感谢 carthurs )或 \s+
如果需要分隔一个或多个空格:
data = pd.read_csv('file.txt', sep="\s+", header = None)
data = pd.read_csv('file.txt', delim_whitespace=True, header = None)
但是如果分隔符是制表符
:
data = pd.read_csv('file.txt', sep="\t", header = None)
关于python - 如何将文本文件加载到 pandas 数据框中?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44157856/
我是一名优秀的程序员,十分优秀!