gpt4 book ai didi

python - Excel 编码影响 pandas 过滤

转载 作者:行者123 更新时间:2023-12-04 20:51:22 25 4
gpt4 key购买 nike

我必须使用准备好的 Excel 文件,所有列都是“常规”。

我想使用 pandas 过滤数据,我所做的是将所有列都设置为 str(),并且除了带有日期的列之外一切正常。

正如我所说的所有列都是“常规”,所以这个文件中的日期只是格式为 dd/mm/yyyy 的文本,我将它过滤为字符串不会有问题(我需要找到一个日期每次搜索),但是当我用 Pandas 阅读它时,我会收到嵌入问号的单元格中的内容(“?dd/mm/yyyy?”)。我将其转换为 b'',得到 b'\xe2\x80\xad14/06/1919\xe2\x80\xac'。我发现了这个代码点的含义:https://www.utf8-chartable.de/unicode-utf8-table.pl?start=8192&number=128&utf8=string-literal ,但仍然不知道该怎么办。
Pandas 将此列识别为“dtype: object”。我应该怎么做才能正确过滤此列?

import pandas as pd

data = pd.read_excel('http://[::1]:8000/FileName.xlsx')
data["Date"] = data["Date"].apply(str)
result_data = data[(data["Date"]==my_date])]

最佳答案

我找到了解决方案 here .

就我而言:

data["Date"] = data["Date"].str.encode('ascii', 'ignore').str.decode('ascii')

关于python - Excel 编码影响 pandas 过滤,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59543332/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com