- mongodb - 在 MongoDB mapreduce 中,如何展平值对象?
- javascript - 对象传播与 Object.assign
- html - 输入类型 ="submit"Vs 按钮标签它们可以互换吗?
- sql - 使用 MongoDB 而不是 MS SQL Server 的优缺点
我想打开我的 file.txt
并拆分该文件中的所有数据。
这是我的 file.txt
:
some_data1 some_data2 some_data3 some_data4 some_data5
这是我的python代码:
>>>file_txt = open("file.txt", 'r')
>>>data = file_txt.read()
>>>data_list = data.split(' ')
>>>print data
some_data1 some_data2 some_data3 some_data4 some_data5
>>>print data_list
['\xef\xbb\xbfsome_data1', 'some_data1', "some_data1", 'some_data1', 'some_data1\n']
正如您在此处看到的,当我打印 data_list
时,它会在我的列表中添加:\xef\xbb\xbf
和:\n
。这些是什么以及如何清除我的列表。
谢谢。
最佳答案
您的文件包含 UTF-8 BOM一开始。
要摆脱它,首先将文件内容解码为 unicode。
fp = open("file.txt")
data = fp.read().decode("utf-8-sig").encode("utf-8")
但最好不要将其编码回 utf-8
,而是使用 unicode
d 文本。有一个很好的规则:尽快将所有输入的文本数据解码为 unicode,并且只使用 unicode;并尽可能晚地将输出数据编码为所需的编码。这将使您免于许多麻烦。
要以某种编码读取更大的文件,请使用 io.open
或 codecs.open
.
同时检查 this .
使用 str.strip()
或 str.rstrip()
摆脱换行符 \n
.
关于python - 拆分函数将 :\xef\xbb\xbf. ..\n 添加到我的列表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18664712/
我安装了 Windows 8.1 Pro 和 visual studio 2013 ultimate我在 C# 和 VB 中创建了新项目并在不做任何更改的情况下构建了它,但我收到了这个错误: 在 XB
在 Build 大会上,宣布将编译 Xaml。这对我的工作影响很大。我们在 Appx 包中读取和修改 XAML 文件。所以,我下载了预览并制作了一个快速示例应用程序,实际上,看不到 XAML 文件。相
当我构建我的项目时,在 VS 升级到 16.4 后出现错误。 根据屏幕截图上的输出窗口,您现在可以看到 VS 尝试引用包含命名空间的 xbf 文件的路径。以前不是。 例如:以前的路径是这样的:C:\P
这个问题在这里已经有了答案: Split function add: \xef\xbb\xbf...\n to my list (3 个答案) 关闭 7 年前。 我试图读取大数据 file.txt
我正在尝试合并一个具有 4 个属性(ID、FIRSTNAME、LASTNAME、SCORE)的对象,使用 JPA 作为 ORM,使用 MySQL 作为 RDBMS,我只更新特定 ID 的分数并得到以下
我有一张表需要处理各种字符。字符包括Ø、®等。 我已将我的表设置为 utf-8 作为默认排序规则,所有列都使用表默认值,但是当我尝试插入这些字符时出现错误:不正确的字符串值:列 '\xEF\xBF\x
我已经为 Windows 通用平台 (Win 10 UWP) 创建了一个类库。 库包含一些用户控件。 当我将此库中的 dll 添加到 Win 10 UWP 应用程序并使用 UserControls 时
我有一张表需要处理各种字符。字符包括Ø、®等。 我已将我的表设置为 utf-8 作为默认排序规则,所有列都使用表默认值,但是当我尝试插入这些字符时出现错误:不正确的字符串值:列 '\xEF\xBF\x
我有一张表需要处理各种字符。字符包括Ø、®等。 我已将我的表设置为 utf-8 作为默认排序规则,所有列都使用表默认值,但是当我尝试插入这些字符时出现错误:不正确的字符串值:列 '\xEF\xBF\x
我想打开我的 file.txt 并拆分该文件中的所有数据。 这是我的 file.txt: some_data1 some_data2 some_data3 some_data4 some_data5
带有 Visual Studio 2015 (RTM) 的通用 Windows 平台应用 我有一个在我的应用程序的多个页面中使用的 DataTemplate,所以我更愿意编写一次并从我需要的任何地方访
我想上传一个UTF-8的文件,我在windows环境下创建utf8文件时自动添加\xef\xbb\xbf 这个 BOM 在文件的开头。问题是我的文件开头必须是 SOF,因为映射工具将检查这个 SOF。
在库中编译 XAML 时出现以下错误: Themes\Generic.xaml(35,12): XamlCompiler error WMC0610: XBF generation error cod
在 Windows 8.1 版本中,有一些新的 API 更改/添加。根据新的添加,有一个称为“XAML 二进制格式”的新功能,它将提高屏幕上的渲染性能。 XamlBinaryWriter类负责转换为
有 MainApplication + BackgroundAudioTask。然后我在同一解决方案中创建了另一个 Windows Phone 8.1 空白应用程序以进行单元测试,并将其命名为 Uni
何时 answering this question ,我编写了这段代码来迭代字符串中的 UTF-8 字节序列: local str = "KORYTNAČKA" for c in str:gmatc
在我的 Django 应用程序中,我上传一个文本文件,使用 file.read() 获取文件内容,然后保存到数据库(使用 Django 的 .save() 方法)。 我收到以下错误: Environm
我是一名优秀的程序员,十分优秀!