python - 在Cloudera VM中阅读教程CSV文件时的异常(exception)-6ren

python - 在Cloudera VM中阅读教程CSV文件时的异常(exception)

转载作者：行者123 更新时间：2023-12-02 21:22:18

25

4

我正在尝试编写Cloudera虚拟机随附的Spark教程。但是，即使我使用正确的行尾编码，也无法执行脚本，因为会出现大量错误。
本教程是Coursera Introduction to Big Data Analytics类(class)的一部分。分配can be found here。

这就是我所做的。安装IPython Shell(如果尚未完成):

sudo easy_install ipython==1.2.1

打开/启动shell(使用1.2.0或1.4.0):

PYSPARK_DRIVER_PYTHON=ipython pyspark --packages com.databricks:spark-csv_2.10:1.2.0

将行尾设置为Windows样式。这是因为该文件是Windows编码的，因此在此过程中已说过。如果不这样做，还会收到其他错误。

sc._jsc.hadoopConfiguration().set('textinputformat.record.delimiter','\r\n')

尝试加载CSV文件:

yelp_df = sqlCtx.load(source='com.databricks.spark.csv',header = 'true',inferSchema = 'true',path = 'file:///usr/lib/hue/apps/search/examples/collections/solr_configs_yelp_demo/index_data.csv')

但是会得到很长的错误列表，它的开始如下:

Py4JJavaError: An error occurred while calling o23.load.: java.lang.RuntimeException: 
Unable to instantiate 
org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient at 
org.apache.hadoop.hive.ql.session.SessionState.start(SessionState.java:472)

完整的错误消息 can be seen here。这是/etc/hive/conf/hive-site.xml

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<configuration>

  <!-- Hive Configuration can either be stored in this file or in the hadoop configuration files  -->
  <!-- that are implied by Hadoop setup variables.                                                -->
  <!-- Aside from Hadoop setup variables - this file is provided as a convenience so that Hive    -->
  <!-- users do not have to edit hadoop configuration files (that may be managed as a centralized -->
  <!-- resource).                                                                                 -->

  <!-- Hive Execution Parameters -->

  <property>
    <name>javax.jdo.option.ConnectionURL</name>
    <value>jdbc:mysql://127.0.0.1/metastore?createDatabaseIfNotExist=true</value>
    <description>JDBC connect string for a JDBC metastore</description>
  </property>

  <property>
    <name>javax.jdo.option.ConnectionDriverName</name>
    <value>com.mysql.jdbc.Driver</value>
    <description>Driver class name for a JDBC metastore</description>
  </property>

  <property>
    <name>javax.jdo.option.ConnectionUserName</name>
    <value>hive</value>
  </property>

  <property>
    <name>javax.jdo.option.ConnectionPassword</name>
    <value>cloudera</value>
  </property>

  <property>
    <name>hive.hwi.war.file</name>
    <value>/usr/lib/hive/lib/hive-hwi-0.8.1-cdh4.0.0.jar</value>
    <description>This is the WAR file with the jsp content for Hive Web Interface</description>
  </property>

  <property>
    <name>datanucleus.fixedDatastore</name>
    <value>true</value>
  </property>

  <property>
    <name>datanucleus.autoCreateSchema</name>
    <value>false</value>
  </property>

  <property>
    <name>hive.metastore.uris</name>
    <value>thrift://127.0.0.1:9083</value>
    <description>IP address (or fully-qualified domain name) and port of the metastore host</description>
  </property>
</configuration>

任何帮助或想法如何解决？我猜这是一个很常见的错误。但是我找不到任何解决方案。

还有一件事:是否有办法将这么长的错误消息转储到单独的日志文件中？

最佳答案

讨论摘要:
执行以下命令可以解决此问题:

sudo cp /etc/hive/conf.dist/hive-site.xml /usr/lib/spark/conf/

关于python - 在Cloudera VM中阅读教程CSV文件时的异常(exception)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/36966550/

25

4

0

文章推荐： hadoop - Dataproc bdutil版本控制

文章推荐： python - 即使已安装Ansible也无法导入docker-py(Ansible 2.3.0.0)

文章推荐： docker - docker run无法从cronjob工作

文章推荐： docker - 使用docker时授权不使用identityserver4

python - 在Python中， 'except Exception as e'和 'except Exception, e'有什么区别
这个问题在这里已经有了答案: Python try...except comma vs 'as' in except (5 个回答) 关闭7年前。在python中，有两种方法可以捕获异常 excep
java - Runtime Exception extends Exception 和 Custom Exception extends from Exception 为什么后一个是编译时异常而另一个不是？
在 Java 中，我有一个从 Exception 扩展的异常类，但是每当我抛出它时，编译器都会说它需要被捕获/必须声明方法 throws异常。当我使用从 Exception 扩展的 RuntimeE
exception - haskell "exceptions"
我有一组用户、组以及用户和组之间的映射。我有各种操作这些集合的函数，但是不能为不存在的用户添加用户组映射，也不能删除仍然有用户作为成员的组等。所以基本上我希望这些函数抛出必须由调用者明确处理的“异常
exception - 最大请求长度超出异常(exception)
我正在尝试使用上载控件上载20兆的文件，并且在Visual Studio的内置Web服务器上可以正常工作，但是一旦将其发布到生产服务器（我无权访问），我总是收到以下错误消息： Server Error
java - 当抛出 'Exception B'时如何断言 "Exception A: Exception B"？
我想断言运行某些代码时会引发特定异常(SSLHandshakeException)。 assertThatThrownBy(() -> { // some code }).is
c++ - 编译错误 - 没有匹配函数调用 'Exception::Exception(Exception)'
这个问题我暂时解决不了。我很乐意提供一些建议。当我尝试抛出异常时(我自己创建了一个 Java 风格的异常) throw Exception (); 编译器提出抗议: DataTypes/Date.c
python - 为什么 "except:"能够捕获此错误，但不能捕获 "except Exception, e:"？
我有以下文件: from fabric.api import env, execute, run env.hosts = ['1.2.3.4'] def taskA(): run('ls')
python - 在 Python 中使用 "except Exception"与 "except ... raise"
我正在阅读一些包含类似于以下功能的源代码: def dummy_function(): try: g = 1/0 except Exception as e:
exception - 值多态和 "generating an exception"
根据标准 ML 的定义(修订版): The idea is that dynamic evaluation of a non-expansive expression will neither gen
exception - 非详尽模式的更好异常(exception)，以防万一
当 GHCi 在运行时发现调用产生的值与函数的模式匹配不匹配时，有没有办法让 GHCi 产生更好的异常消息？它目前给出了产生非详尽模式匹配的函数的行号，虽然有时会有所帮助，但确实需要一轮调试，有时我
exception - 我有时沉没异常(exception)可以吗？
我有一个最佳实践问题。我意识到这是主观的，但想问问比我更聪明的人，这是否是一种常见的编程实践。如果您有一种不希望干扰应用程序重要功能的非关键方法，那么使用这样的错误接收器是否常见？ Try
exception - 术语-异常(exception)
在编程中，异常是否总是错误(被零除，访问冲突等等)？如果不是，您能否提供不是错误的异常示例？谢谢。最佳答案异常通常用于管理错误，它们使错误处理更加容易，但它们并不总是错误。任何需要单独代码路
exception - OCaml 内部结构 : Exceptions
我很想知道 OCaml 运行时如何处理异常以使它们如此轻量。他们是使用 setjmp/longjmp 还是在每个函数中返回一个特殊值并传播它？在我看来，longjmp会给系统带来一点压力，但只有在引
c# - 当我有 System.Exception 和 MyNamespace.Exception 时，为什么捕获 "Exception"没有歧义？
在我的 C# 代码中，我可以访问 MyNamespace.Exception 以及 System.Exception。当我想捕获其中一个异常时，理想情况下我会完全限定要捕获的异常或使用别名来明确说明。
c++ - std::exception::_Raise 和 std::exception::exception 上的 VC++ 链接器错误
我正在使用 Visual C++ 2005 Express Edition 并遇到以下链接器错误: 19>mylib1.lib(mylibsource1.obj) : error LNK2019: u
java - IntelliJ IDEA : How can I create an exception breakpoint that stops on all exceptions *except for* ClassNotFoundException?
这个问题在这里已经有了答案: Is there "Break on Exception" in IntelliJ? (6 个回答) 关闭7年前。我想在调试器中运行我的测试套件并中断任何意外异常，但是
java - LOGGER.error(exception.getMessage()) 和 LOGGER.error(exception.getMessage(), exception) 有什么区别
Like in this picture 我知道它们都可以正常工作，但我只是想知道它们之间有何不同？ PS:我是初学者。最佳答案 A LogEvent可以同时包含消息和异常。如果您使用第一种形式:
exception - 跳过异常(exception) Doctrine 迁移
我知道避免 Doctrine 上的异常似乎是一种奇怪的行为，但我需要这样做，因为我在一个旧项目中工作，过去有人执行了一些迁移，然后他决定删除它，所以现在复制起来很复杂本地生产环境没有崩溃，这就是为什么
exception - 蛋糕PHP 2 : new exceptions
我想创建一个名为 SecurityException 的新异常。我应该把代码放在哪里？ class SecurityException extends CakeException {}; 谢谢! 最
exception-handling - 有标准异常(exception)吗？
我一直在使用throw new Exception("...")在我的代码中，因为我找不到其他可以使用的东西。我正在寻找像 C++'s 这样的东西 out_of_range 和 logic_error

首页

博学

6Ren·AI

商城

python - 在Cloudera VM中阅读教程CSV文件时的异常(exception)