r - 在sparklyr中使用spark_read_csv报错 "Invalid method csv for object"-6ren

r - 在sparklyr中使用spark_read_csv报错 "Invalid method csv for object"

转载作者：可可西里更新时间：2023-11-01 16:39:33

26

4

我正在尝试从 hdfs 读取 R 中的数据。在使用 sparklyr 时，我遇到的一件事是破译错误消息……因为我不是 Java 程序员。

考虑这个例子:

在 R 中执行此操作

创建鲍鱼数据框 - 鲍鱼是用于机器学习示例的数据集

load pivotal R package #contains abalone data and create dataframe
if (!require(PivotalR)){ 
  install.packages(PivotalR) }

data(abalone)

#sample of data
head(abalone)

#export data to a CSV file
if (!require(readr)){ 
  install.packages(readr) }
write_csv(abalone,'abalone.csv')

在命令行执行此操作

hdfs dfs -put abalone.csv abalone.csv
#check to see if the file is on the hdfs
hdfs dfs -ls

在 R 中执行此操作这设置为使用您当前版本的 spark你可能需要改变 spark_home

  library(sparklyr)
    library(SparkR)
    sc = spark_connect(master = 'yarn-client',
                       spark_home = '/usr/hdp/current/spark-client',
                       app_name = 'sparklyr',
                       config = list(
                         "sparklyr.shell.executor-memory" = "1G",
                         "sparklyr.shell.driver-memory"   = "4G",
                         "spark.driver.maxResultSize"     = "2G" # may need to transfer a lot of data into R 
    )
    )

读入我们刚刚写入HDFS的鲍鱼文件。您将必须更改路径以匹配您的路径。

df <- spark_read_csv(sc,name='abalone',path='hdfs://pnhadoop/user/stc004/abalone.csv',delimiter=",",
                         header=TRUE)

我收到以下错误:

Error: java.lang.IllegalArgumentException: invalid method csv for object 63
        at sparklyr.Invoke$.invoke(invoke.scala:113)
        at sparklyr.StreamHandler$.handleMethodCall(stream.scala:89)
        at sparklyr.StreamHandler$.read(stream.scala:55)
        at sparklyr.BackendHandler.channelRead0(handler.scala:49)
        at sparklyr.BackendHandler.channelRead0(handler.scala:14)
        at io.netty.channel.SimpleChannelInboundHandler.channelRead(SimpleChannelInboundHandler.java:105)
        at io.netty.channel.AbstractChannelHandlerContext.invokeChannelRead(AbstractChannelHandlerContext.java:308)
        at io.netty.channel.AbstractChannelHandlerContext.fireChannelRead(AbstractChannelHandlerContext.java:294)
        at io.netty.handler.codec.MessageToMessageDecoder.channelRead(MessageToMessageDecoder.java:103)
        at io.netty.channel.AbstractChannelHandlerContext.invokeChannelRead(AbstractChannelHandlerContext.java:308)
        at io.netty.channel.AbstractChannelHandlerContext.fireChannelRead(AbstractChannelHandlerContext.java:294)
        at io.netty.handler.codec.ByteToMessageDecoder.channelRead(ByteToMessageDecoder.java:244)
        at io.netty.channel.AbstractChannelHandlerContext.invokeChannelRead(AbstractChannelHandlerContext.java:308)
        at io.netty.channel.AbstractChannelHandlerContext.fireChannelRead(AbstractChannelHandlerContext.java:294)
        at io.netty.channel.DefaultChannelPipeline.fireChannelRead(DefaultChannelPipeline.java:846)
        at io.netty.channel.nio.AbstractNioByteChannel$NioByteUnsafe.read(AbstractNioByteChannel.java:131)
        at io.netty.channel.nio.NioEventLoop.processSelectedKey(NioEventLoop.java:511)
        at io.netty.channel.nio.NioEventLoop.processSelectedKeysOptimized(NioEventLoop.java:468)
        at io.netty.channel.nio.NioEventLoop.processSelectedKeys(NioEventLoop.java:382)
        at io.netty.channel.nio.NioEventLoop.run(NioEventLoop.java:354)
        at io.netty.util.concurrent.SingleThreadEventExecutor$2.run(SingleThreadEventExecutor.java:111)
        at io.netty.util.concurrent.DefaultThreadFactory$DefaultRunnableDecorator.run(DefaultThreadFactory.java:137)
        at java.lang.Thread.run(Thread.java:745)

不知道发生了什么。我以前使用过 spark_read_csv 没有错误。我不知道如何破译 java 错误。想法？

最佳答案

星火 2.1.0

sparkR.session( sparkConfig = list(),enableHiveSupport= FALSE)
df1 <- read.df(path="hdfs://<yourpath>/*",source="csv",na.strings = "NA", delimiter="\u0001")
head(df1)

关于r - 在sparklyr中使用spark_read_csv报错 "Invalid method csv for object"，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/44285825/

26

4

0

文章推荐： c++ - 构造中的单个值与构造的参数列表

文章推荐： c++ - 用 GCC 编译时还需要使用 -fPIC 吗？

文章推荐： c++ - 评估潜在常量表达式期间的未定义行为

spring - Spring Boot Cloud Foundry 报错 No unique service maching interface 报错
我正在努力学习本教程 https://github.com/cf-platform-eng/spring-boot-cities/tree/master/cities-service在 Cloud F
Php表单提交-报错
0){ echo "Username or email already exists."; }else{ $query = mysql_que
Linux配置ARToolKit，报错
我想在Linux上编译ARToolKit源码，下载源码，按照ARToolKit文档，配置GLUT , OpenGL, libjpeg 等库。转到 ARToolKit 目录并键入 ./Configer
C++ 报错
你好，我在这个程序中遇到错误，wcout 不是 `std' 的成员。如您所见，我也使用了 iostream，但没有用。我有 Dev-C++ 4.9.9.2，我的操作系统是 XP SP3我需要你的帮助。
Goroutine 报错
我尝试对一个网站进行多次投票，但我得到: panic: runtime error: invalid memory address or nil pointer dereference [signal
c++ - 用sort对字符串数组进行排序，报错
当我将“ using namespace std; int main(){ string s[30]; int n = 20; for(int i = 0; i using
Meteorjs sendVerificationEmail 报错
我设置了 EMAIL_URL process.env.MAIL_URL="smtp://xx%40gmail.com:yyy@smtp.gmail.com:465" 这个工作找到了 Email.sen
docker-compose up 报错
我有如下文件夹结构 . ├── docker-compose.yml └── web-app ├── create_tomcat_admin.sh ├── Dockerfile
php - mysql_fetch_assoc() 报错
这是我在 php 中的查询代码: $query3 = mysql_query("SELECT * FROM area_of_work") or die('Invalid query:'. mysql_
heroku - 无法安装therubyracer，报错
我正在尝试将 therubyracer/therubyracer-heroku 安装到我的应用程序，因为它在 heroku 服务器中不起作用，因为我没有 javascript 运行时环境。当我尝试安
javascript - this.setState 报错
我正在开发一个非常简单的 React 应用程序。它有一个组件，在这个组件中，我试图在单击链接时设置状态。但出于某种原因，setState 甚至没有得到认可。它带有下划线，表示未解析的函数或方法 set
c++ - 预定义struct，报错
我有三个来源:代码处理.h typedef enum {typeBool, typeVarDeclaration, typeFuncDeclaration } nodeEnum; typedef st
Android sshj发送多个命令，报错
我正在尝试从我的 Android 手机向 raspi 发送连续的命令。我使用了此链接中的代码，但出现错误。链接:https://stackoverflow.com/questions/2347143
android - Sqlite 报错
我正在尝试从数据库中加载数据并将其放入不同的 View 中。 log cat 返回错误，它找不到“_id”列。有人可以帮我解决这个问题吗？ SqlHelper代码: public class Fib
ios - UIAlertView 报错
我的alertview给出了这个问题..它与sqlite无关..它给出了一些信息.. 我该如何解决这个问题？ UIAlertView *infoShow = [[UIAlertView alloc]
Android编程(找不到处理intent异常的类)报错
这个问题在这里已经有了答案: launch activities from different package (5 个答案) 关闭 10 年前。最近我一直在开发一个新的应用程序，我正在尝试使用
c - 使用一个struct来发音多个变量，报错
这是我的代码: #include #include typedef struct test { int *a; char *s; }TEST; int main (void) {
python - 在python类中实现归并排序功能，报错
所以我定义了一个函数，如果它是由它的 lonesome 实现的，那么它非常适合对线性数组进行合并排序，但是如果我把它放到一个类中，它就会出错。我认为这是一个很好的例子，说明我不太了解类(class)的
ios - UIAlertController 报错
我是 IOS 新手。我有一个示例项目，并试图在此基础上学习 Obj-C。现在我正处于学习如何使用 UIAlertController 的阶段。我有这样的代码: if (loanAmount == 0
windows - Wincachegrind 报错
当我尝试使用 wincachegrind 并获取 cachegrind 文件时，它返回 Cannot find call target. cachegrind.out line number:68 有

首页

博学

6Ren·AI

商城

r - 在sparklyr中使用spark_read_csv报错 "Invalid method csv for object"