gpt4 book ai didi

mysql - 将数据从 MySQL DB 提取到 R 时的编码问题

转载 作者:行者123 更新时间:2023-11-30 22:42:54 24 4
gpt4 key购买 nike

我正在使用 R 中的“RMySQL”库将数据从本地 MySQL 数据库加载到 R:

con <- dbConnect(MySQL(), user="root", password="****", dbname="twitterdata", host="localhost")
dataframe <- dbGetQuery(con, "SELECT id, plaintext, category FROM table")

当我检查数据框时,我看到很多未格式化的字符,例如显示为 的倾斜撇号 (´)。

经过一些研究,我发现根据this站点,一些特殊字符(包括斜撇号)不是 ISO-8859-1 标准的一部分,而是 Windows-1252 标准的一部分。

当我运行时

Sys.getlocale("LC_CTYPE")

在 R 中,它说:

"German_Austria.1252"

它不是已经说我使用了正确的编码吗?!在我的数据库中(默认字符集:UTF-8),撇号的编码很好。

我还尝试将参数添加到 dbConnect 语句 DBMSencoding="utf-8" 但没有效果。

当我运行时

Encoding(x)

在R中(其中x是字符向量——一个句子),答案是

"unknown"

现在有人知道如何解决这个问题吗?

非常感谢!

最佳答案

这样做:

con <- dbConnect(MySQL(), user="root", password="****", dbname="twitterdata", host="localhost", encoding = "latin1")

关于mysql - 将数据从 MySQL DB 提取到 R 时的编码问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30619531/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com