gpt4 book ai didi

以 UTF-8 编码读取文本

转载 作者:行者123 更新时间:2023-12-01 17:26:07 24 4
gpt4 key购买 nike

假设我编写了一个函数来解析包含德语的输入流。下面是一个玩具示例。以下在我的机器上工作(因为 UTF8 是标准的):

readLines(textConnection("Zürich"))
readLines(textConnection("Z\u00FCrich")) #same thing

但是我想确保它在 UTF-8 时也能正常工作不是当前的语言环境编码。例如在 rApache 中,默认为 ascii .因此我传递了编码参数:
readLines(textConnection("Zürich", encoding="UTF-8"))
readLines(textConnection("Z\u00FCrich", encoding="UTF-8"))

但这实际上会导致输出困惑。为什么是这样?我该怎么打电话 textConnection确保在任何平台或语言环境中正确读取流?

最佳答案

@flodel 的建议确实起到了作用:

readLines(textConnection("Z\u00FCrich", encoding="UTF-8"), encoding="UTF-8")

然而,我从来没有清楚为什么需要这样做。

关于以 UTF-8 编码读取文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17512834/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com