gpt4 book ai didi

r - 如何读取列名为 "Hebrew"的表(在 R 中)?

转载 作者:行者123 更新时间:2023-12-02 03:23:40 24 4
gpt4 key购买 nike

我正在尝试读取带有希伯来语列名称的 .txt 文件,但没有成功。

我将示例文件上传到: http://www.talgalili.com/files/aa.txt

我正在尝试命令:

read.table("http://www.talgalili.com/files/aa.txt", header = T, sep = "\t")

这给我返回:

  X.....ª X...ª...... X...œ....
1 12 97 6
2 123 354 44
3 6 1 3

而不是:

אחת שתיים   שלוש
12 97 6
123 354 44
6 1 3

我的输出:

l10n_info()

是:

$MBCS
[1] FALSE

$`UTF-8`
[1] FALSE

$`Latin-1`
[1] TRUE

$codepage
[1] 1252

对于:

Sys.getlocale()

是:

[1] "LC_COLLATE=English_United States.1252;LC_CTYPE=English_United States.1252;LC_MONETARY=English_United States.1252;LC_NUMERIC=C;LC_TIME=English_United States.1252"

您能否建议我尝试和更改哪些内容以允许我正确加载文件?

更新:尝试使用:

read.table("http://www.talgalili.com/files/aa.txt",fileEncoding ="iso8859-8")

已导致:

 V1
1 ?
Warning messages:
1: In read.table("http://www.talgalili.com/files/aa.txt", fileEncoding = "iso8859-8") :
invalid input found on input connection 'http://www.talgalili.com/files/aa.txt'
2: In read.table("http://www.talgalili.com/files/aa.txt", fileEncoding = "iso8859-8") :
incomplete final line found by readTableHeader on 'http://www.talgalili.com/files/aa.txt'

同时也尝试这个:

Sys.setlocale("LC_ALL", "en_US.UTF-8")

或者这个:

Sys.setlocale("LC_ALL", "en_US.UTF-8/en_US.UTF-8/C/C/en_US.UTF-8/en_US.UTF-8")

给我这个:

[1] ""
Warning message:
In Sys.setlocale("LC_ALL", "en_US.UTF-8") :
OS reports request to set locale to "en_US.UTF-8" cannot be honored

最后,这是 > sessionInfo()

R version 2.10.1 (2009-12-14) 
i386-pc-mingw32

locale:
[1] LC_COLLATE=English_United States.1255 LC_CTYPE=English_United States.1252 LC_MONETARY=English_United States.1252 LC_NUMERIC=C
[5] LC_TIME=English_United States.1252

attached base packages:
[1] stats graphics grDevices utils datasets methods base

loaded via a namespace (and not attached):
[1] tools_2.10.1

如有任何建议或澄清,我们将不胜感激。

最好,塔尔

最佳答案

我会尝试将参数fileEncoding传递给read.table,其值为iso8859-8

使用 iconvlist() 获取支持的编码的字母顺序列表。正如我所见here希伯来语必须是 ISO 8859 的第 8 部分。

关于r - 如何读取列名为 "Hebrew"的表(在 R 中)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2471075/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com