>> s2=unicode(s1,"utf-8") >>> s2 u'\u4-6ren">
gpt4 book ai didi

r - 如何在R中转换编码

转载 作者:行者123 更新时间:2023-12-04 05:33:52 25 4
gpt4 key购买 nike

这是python中的一些转换,语言环境是“utf-8”

>>> s1="你好"   #你好 = how are you?
>>> s2=unicode(s1,"utf-8")
>>> s2
u'\u4f60\u597d' #s2 is the unicode form of s1
>>> s3=s2.encode("utf-8")
>>> s3
'\xe4\xbd\xa0\xe5\xa5\xbd' #s3 is the utf-8 form of s1
>>> s4=s2.encode("gbk")
>>> s4
'\xc4\xe3\xba\xc3' #s3 is the gbk form of s1
我怎样才能在 R 中做到这一点?

最佳答案

有两个函数可以帮助您从 utf-8 转换至 hexmode :

  • utf8ToInt
  • as.hexmode

  • 试试这个:
    as.hexmode(utf8ToInt(s1))
    [1] "4f60" "597d"

    但至于 gbk转换,对不起,我没有线索。

    关于r - 如何在R中转换编码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12227379/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com