gpt4 book ai didi

R字符串,UTF-8编码瑞典字符处理

转载 作者:行者123 更新时间:2023-12-05 03:02:16 40 4
gpt4 key购买 nike

在 R 中以可呈现的方式更改瑞典语字符 ä ö å 时遇到问题
我直接从 MS SQL 数据库获取数据
这是例子

markets <- c("Caf\xe9                          ","Restaurang kv\xe4ll              ","Barnomsorg tillagningsk\xf6k     ","Folkh\xf6gskola                  ")

然后我使用 gusb 删除左边的空格

market=gsub(" ", "", markets,fixed = TRUE)

我得到了这个错误:
gsub("", "", market, fixed = TRUE) 错误:
输入字符串 3 是无效的 UTF-8

然后我使用这个命令:
markets_new=gsub("", "", 市场)

然后字符串中出现奇怪的汉字,“咖啡厅改㸹”"Restauranglunch+kv拼㸴ll""Barnomsorgtillagningsk昼㸶k"“民俗昼㸶gskola”

我尝试通过以下方式更改 Rstudio 的默认设置: https://yihui.name/en/2018/11/biggest-regret-knitr/?fbclid=IwAR2E5Lp0zjS51fcdjgZ1tej0sg5EBxfG8sNitt-cUA2XEshnT3lNCHNQ3Do

它没有帮助,也尝试使用 gsub() 替换字符但似乎不起作用。

还有一件事,如果我使用

write.csv(markets,'submarket product view.csv',row.names = F)

然后在我的 csv 文件中我看到如下内容

"Caf<e9>                          "
"Restaurang kv<e4>ll "
"Barnomsorg tillagningsk<f6>k "
"Folkh<f6>gskola "
"Sm<f6>rg<e5>s/salladsrestaurang "

我认为<e9> e 戴着帽子,<e4>是 ä, <f6>是 ö,并且 <e5>是å
有什么治疗建议吗?

最佳答案

感谢@Wiktor Stribiżew这个解决方案效果最好:

df$m <- gsub(" ", "", `Encoding<-`(as.character(df$m), "latin1"),fixed = TRUE) 

关于R字符串,UTF-8编码瑞典字符处理,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55039860/

40 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com