gpt4 book ai didi

python - 写入和读取 csv 文件 python

转载 作者:太空宇宙 更新时间:2023-11-04 05:01:29 24 4
gpt4 key购买 nike

我有一个 text 文件,其中包含非英文字母的单词,我想打开它,进行一些预处理,最后将其保存为 .csv 文件,然后在其他地方使用它。

读取和存储文件的代码:

with open('file.txt', encoding="utf-8") as f:
train = f.read().splitlines()

然后创建一个数据框,以及存储它的代码:

df.to_csv('file.csv', index=True, encoding="utf-8")

util 现在一切似乎都正常,但是当我尝试使用以下代码打开 file.csv 时:

train = pd.read_csv('file.csv', encoding="utf-8")

我面对这个:

Process finished with exit code -1073740940 (0xC0000374)

不转到下一行。

另外,当我尝试使用 ISO-8859-1 编码打开它时,它没问题;但是当我尝试打印那个 .csv 的头部时,它只是打印了一些问号('?')

有人知道哪里出了问题吗?

最佳答案

我尝试用这段代码重现它:

import pandas as pd

with open('persian.txt', encoding="utf-8") as f:
train = f.read().splitlines()
df = pd.DataFrame({'text': train})
df.to_csv('file.csv', index=True, encoding="utf-8")
train = pd.read_csv('file.csv', encoding="utf-8")

一个包含两行示例波斯文本的 txt 文件。它在 Python 3 中运行没有任何问题,生成了这个 csv:

    text
0 همهٔ افراد بشر آزاد به دنیا می‌آیند و حیثیت و حقوق شان با هم برابر است
1 همه اندیشه و وجدان دارند و باید در برابر یکدیگر با روح برادری رفتار کنند.

您能否提供有关文本属性和您在数据框处理中执行的操作的更多详细信息,或者确定阅读中断的行?您可能会在途中产生一些无效字符。

关于python - 写入和读取 csv 文件 python,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45630531/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com