gpt4 book ai didi

r - 如何将默认的 UTF-8 编码更改为 LATIN1

转载 作者:行者123 更新时间:2023-12-03 15:57:35 31 4
gpt4 key购买 nike

第一次来电。
我只想将字符串编码从 UTF-8 更改为 LATIN1。我使用 Xpath 从 Web 检索数据:

>library(RCurl)  
>library(rvest)
>library(XML)
>library(httr)
>library(reshape2)
>library(reshape)

>response <- GET(paste0("http://www.visalietuva.lt/imone/jogminda-uab-telsiai-muziejaus-g-35"))
>doc <- content(response,type="text/html")
>base <- xpathSApply(doc, "//ul//li//span",xmlValue)[5]

结果我得到以下信息:

>base
[1] "El. paštas"

当我检查编码时,我有 UTF-8:

>Encoding(base)
[1] "UTF-8"

我怀疑我需要 LATIN1 编码。这样结果将是"El.paštas",而不是"El.paÅ¡tas"

虽然当我指定 LATIN1 编码时,我得到以下信息:

>latin <- iconv(base, from = "UTF-8", to = "LATIN1")
[1] "El. paštas"

即与 UTF-8 相同的结果。更改编码无助于获取 "El.paštas"

此外,在将数据保存到 .csv 文件时,我需要对字符串进行正确的 LATIN1 编码。我尝试将数据保存到 .csv:

write.table(latin,file = "test.csv")

得到和上面一样的奇怪字符:"El.paÅ¡tas"

我们非常欢迎任何关于如何更改编码的建议。谢谢。

最佳答案

尝试

doc <- content(response,type="text/html", encoding = "UTF-8")

关于r - 如何将默认的 UTF-8 编码更改为 LATIN1,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28500060/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com