gpt4 book ai didi

sql - 如何在我的 R 数据框中更改/清理此特定行值 [数据类型字符串]

转载 作者:搜寻专家 更新时间:2023-10-30 23:44:11 24 4
gpt4 key购买 nike

我有一个示例数据框,其中所有列的第 1 行和第 2 行 [第 1 列除外] 包含如下数据:

enter image description here

我怎样才能简单地保持像这样的数字

选项 1:只有 8.492 亿(1300 万美元)以内的数字[5]”,因此结果为“13”

选项 2:只有 8.492 亿(1300 万美元)以内的数字和单位[5]”,因此结果为“1300 万”

起初我试图找到起始位置以便我可以稍后应用 substr 但它给出了错误:

>grep("US$",df[1,1],fixed=TRUE))
integer(0)

有没有什么办法可以将数据转储到 sqlite 中或使用 sqldf 包等来进行清理……什么的?这个逐个字符串的清理对我来说不太好。

最佳答案

gsub('.*US\\$(.*)\\).*', '\\1', x)
[1] "13 million" "11 million" "1.6 million"
[4] "5.6 million

gsub('.*US\\$(.*) .*', '\\1', x)
[1] "13" "11" "1.6" "5.6"

数据

x <- c("<U+20B9>84.92 crore (US$13 million)[5]", "<U+20B9>680 million (US$11 million)", 
"<U+20B9>100 crore (US$1.6 million)[4]","<U+20B9>350 million (US$5.6 million)")

关于sql - 如何在我的 R 数据框中更改/清理此特定行值 [数据类型字符串],我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31075467/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com