gpt4 book ai didi

python - R 作为通用编程语言

转载 作者:太空狗 更新时间:2023-10-29 17:13:52 24 4
gpt4 key购买 nike

<分区>

我以前喜欢 Python,因为 Python 有丰富的内置类型,如集合、字典、列表、元组。这些结构有助于编写简短的脚本来处理数据。

另一方面,R就像Matlab一样,有标量、向量、数据框、数组和列表作为它的数据类型。但是它缺少集合,字典,元组等。我知道列表类型很强大,很多操作都可以认为是列表处理。但是使用 R 作为通用语言的想法仍然很模糊。

(以下只是一个例子,并不意味着我专注于文本处理/挖掘。)

例如,我需要对一组新闻文章进行 TF-IDF 计数(比如一个文件夹及其子文件夹中有 200,000 篇文章)。

读取文件后,我需要进行单词到 ID 的映射和其他计数任务。这些任务涉及字符串操作,需要像 set 或 map 这样的容器。

我知道我可以使用另一种语言来进行这些处理并将数据加载到 R 中。但也许(对于小事情)将所有预处理放入单个 R 脚本中会更好。

所以我的问题是,在语言层面上,R 是否有足够的能力处理这种丰富的数据结构?或者,如果没有,是否有任何软件包为 R 语言提供了良好的扩展?

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com