gpt4 book ai didi

Python XML CSV 编码和字符

转载 作者:太空宇宙 更新时间:2023-11-04 01:36:42 24 4
gpt4 key购买 nike

在跟进一个问题时,有人昨天在这里帮助了我 Lost in XML and Python我正在尝试比较两个字符串。

  • 从 XML 文件中读取字符串 1
  • 从 CSV 文件中读取字符串 2

问题是两者的存储方式不同:

CSV FILE HAS : "‚"
XML FILE HAS : "‚"

但没有“

在比较时打印字符串告诉我为什么它们不匹配:

这些是它试图匹配的字符串

FROM XML : ‚
FROM CSV : x82

这可能会发生在比这个特定角色更多的角色上。我的问题是如何解决这个问题?

  • 以不同的方式读取 XML 文件?
  • 以不同的方式读取 CSV 文件?
  • 在比较之前转换存储的字符串?

比较后匹配的字符串需要以XML中字符串的格式存储并打印回来。

这是我打开和阅读我的 csv 文件的方式:

import csv
csvdata = csv.reader(open('csvsmall.csv'))

csvfile = open(csvinput, "rb")
dialect = csv.Sniffer().sniff(csvfile.read(1024))
csvfile.seek(0)
reader = csv.reader(csvfile, dialect)

============================更新================== ==========================

好的,根据回复。我认为找到一种方法将 CSV 文件中的转义字符串转换为 XML 文件中的版本是最简单的

这意味着转换:

"," which looks like it is being read as x82 to "‚"

有没有人对如何对存储在字典中的 csv 的所有值执行此操作有任何提示? :

filenameToLabel = {}
for l,f in (x.strip().split(';') for x in (csvfile.readlines())[1:]):
filenameToLabel[f] = l

最佳答案

我遇到了一个和你一样的问题。解决我的问题的是将字符串转换为 unicode,如果不是的话。我想可能有一种更像 Python 的方法,但这对我有用。

为了解析 XML 文件,我使用 lxml , 可以编写 unicode xml 文件。

关于Python XML CSV 编码和字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9079267/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com