gpt4 book ai didi

r - tolower()无效的多字节字符串错误

转载 作者:行者123 更新时间:2023-12-03 21:18:09 25 4
gpt4 key购买 nike

这是我尝试在无法更改的文件的字符向量上运行tolower()时收到的错误(至少,不是手动-太大)。

Error in tolower(m) : invalid multibyte string X

É字符似乎是法国公司名称的问题。尽管我还没有全部研究(也无法手动进行)。

这很奇怪,因为我认为应该在read.csv()期间而不是在事后操作期间识别编码问题。

有没有一种快速的方法来删除这些多字节字符串?或者,也许是一种识别和转换的方法?甚至只是完全忽略它们?

最佳答案

这是我解决问题的方法:

首先,我在文本编辑器(在本例中为Geany)中打开了原始数据,单击了属性并确定了编码类型。

之后,我使用了iconv()函数。

x <- iconv(x,"WINDOWS-1252","UTF-8")


更具体地说,我对导入的CSV中 data.frame的每一列进行了此操作。重要的是要注意,我在 stringsAsFactors=FALSE调用中设置了 read.csv()

dat[,sapply(dat,is.character)] <- sapply(
dat[,sapply(dat,is.character)],
iconv,"WINDOWS-1252","UTF-8")

关于r - tolower()无效的多字节字符串错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13187605/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com