gpt4 book ai didi

python - 从 pandas 数据框中删除特定字符

转载 作者:太空宇宙 更新时间:2023-11-03 17:21:28 25 4
gpt4 key购买 nike

我有一个 csv 文件,其中似乎有几个值,其中包含垃圾数据,如下所示: ¡ ¡

我已将文件导入到 pandas 数据框中。我怎样才能摆脱这些角色?我想删除具有此类字符的单元格内容并放入一个标志值(例如 -99999)。该表具有混合数据类型。

import pandas as pd
import codecs
import unicodedata
import csv
import StringIO

testData = pd.read_csv('Data.csv', encoding="iso-8859-1", engine='python')

/使用编码 utf-8 会出现有关无效起始字节的错误,使用默认引擎也不起作用。/

有什么建议吗?

最佳答案

如果您知道您愿意接受哪些字符,您可以使用正则表达式来过滤您的值,例如:

testData['stringcol'].where(testData['stringcol'].str.contains('[^A-Za-z0-9\s]'), 
-999999)

关于python - 从 pandas 数据框中删除特定字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33093934/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com