gpt4 book ai didi

r - 使用 R 内核在 Azure ML Notebook 中创建数据框

转载 作者:行者123 更新时间:2023-12-03 06:50:21 30 4
gpt4 key购买 nike

我已经在 R 中编写了一些脚本,我必须在 azure ml 笔记本中运行这些脚本,但我没有找到太多文档如何通过在具有 R 内核的笔记本中运行代码来创建数据集。我编写了以下与 python 内核一起使用的 python 代码:

from azureml.core import Dataset, Datastore,Workspace

subscription_id = 'abc'
resource_group = 'pqr'
workspace_name = 'xyz'

workspace = Workspace(subscription_id, resource_group, workspace_name)
datastore = Datastore.get(workspace, 'workspaceblobstore')

# create tabular dataset from all parquet files in the directory
tabular_dataset_3 = Dataset.Tabular.from_parquet_files(path=(datastore,'/UI/09-17-2022_125003_UTC/userdata1.parquet'))

df=tabular_dataset_3.to_pandas_dataframe()

它与 python 内核配合得很好,但我想在带有 R 内核的笔记本中执行等效的 R 代码。

谁能帮我看看等效的 R 代码是什么?任何帮助将不胜感激。

最佳答案

要创建 R 脚本并使用数据集,首先我们需要将数据集注册到门户。将数据集添加到门户后,我们需要获取数据集 URL 并打开笔记本并使用 R 内核。

enter image description here

上传数据集并获取数据源URL

enter image description here

转到机器学习工作室并创建一个新笔记本。

使用下面的 R 脚本获取数据集并将其转换为数据帧。

azureml_main <- function(dataframe1, dataframe2){
print("R script run.")
run = get_current_run()
ws = workspacename
dataset = azureml$core$dataset$Dataset$get_by_name(ws, “./path/insurance.csv")
dataframe2 <- dataset$to_pandas_dataframe()
# Return datasets as a Named List
return(list(dataset1=dataframe1, dataset2=dataframe2))

}

关于r - 使用 R 内核在 Azure ML Notebook 中创建数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/73756301/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com