c# - 提交 C# MapReduce 作业 Windows Azure HDInsight - 响应状态代码不表示成功 : 500 (Server Error)-6ren

c# - 提交 C# MapReduce 作业 Windows Azure HDInsight - 响应状态代码不表示成功 : 500 (Server Error)

转载作者：可可西里更新时间：2023-11-01 14:20:03

26

4

我正在尝试将 MapReduce 作业提交到 HDInsight 群集。在我的工作中，我没有写减少部分，因为我不想减少任何东西。我想做的就是解析每个文件名并将值附加到文件中的每一行。这样我就可以获得文件中所需的所有数据。

我的代码是

using Microsoft.Hadoop.MapReduce;
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Threading.Tasks;

namespace GetMetaDataFromFileName
{
    class Program
    {
        static void Main(string[] args)
        {
            var hadoop = connectAzure();

            //Temp Workaround to Env Variables
            Environment.SetEnvironmentVariable("HADOOP_HOME", @"c:\hadoop");
            Environment.SetEnvironmentVariable("Java_HOME", @"c:\hadoop\jvm");

            var result = hadoop.MapReduceJob.ExecuteJob<MetaDataGetterJob>();
        }

        static IHadoop connectAzure()
        {
            //TODO: Update credentials and other information
            return Hadoop.Connect(
                new Uri("https://sampleclustername.azurehdinsight.net//"),
                "admin",
                "Hadoop",
                "password",
                "blobstoragename.blob.core.windows.net", //Storage Account that Log files exists
                "AccessKeySample", //Storage Account Access Key
                "logs", //Container Name
                true
                );
        }

        //Hadoop Mapper
        public class MetaDataGetter : MapperBase
        {
            public override void Map(string inputLine, MapperContext context)
            {
                try
                {
                    //Get the meta data from name of the file
                    string[] _fileMetaData = context.InputFilename.Split('_');

                    string _PublicIP = _fileMetaData[0].Trim();
                    string _PhysicalAdapterMAC = _fileMetaData[1].Trim();
                    string _BootID = _fileMetaData[2].Trim();
                    string _ServerUploadTime = _fileMetaData[3].Trim();
                    string _LogType = _fileMetaData[4].Trim();
                    string _MachineUpTime = _fileMetaData[5].Trim();

                    //Generate CSV portion
                    string _RowHeader = string.Format("{0},{1},{2},{3},{4},{5},", _PublicIP, _PhysicalAdapterMAC, _BootID, _ServerUploadTime, _LogType, _MachineUpTime);

                    //TODO: Append _RowHeader to every row in the file.
                    context.EmitLine(_RowHeader + inputLine);
                }
                catch(ArgumentException ex)
                {
                    return;
                }
            }
        }

        //Hadoop Job Definition
        public class MetaDataGetterJob : HadoopJob<MetaDataGetter>
        {
            public override HadoopJobConfiguration Configure(ExecutorContext context)
            {
                //Initiate the job config
                HadoopJobConfiguration config = new HadoopJobConfiguration();
                config.InputPath = "asv://<a href="https://stackoverflow.com/cdn-cgi/l/email-protection" class="__cf_email__" data-cfemail="167a7971655665777b667a7338747a7974387579647338617f787279616538787362" rel="noreferrer noopener nofollow">[email protected]</a>/Input";
                config.OutputFolder = "asv://<a href="https://stackoverflow.com/cdn-cgi/l/email-protection" class="__cf_email__" data-cfemail="b0dcdfd7c3f0c3d1ddc0dcd59ed2dcdfd29ed3dfc2d59ec7d9ded4dfc7c39eded5c4" rel="noreferrer noopener nofollow">[email protected]</a>/Output";
                config.DeleteOutputFolder = true;
                return config;
            }
        }
    }
}

您通常认为 500(服务器错误)的原因是什么？我是否提供了错误的凭证？实际上我并没有真正理解 Hadoop.Connect 方法中的 Username 和 HadoopUser 参数之间的区别？

谢谢，

最佳答案

我过去遇到过大致相同的问题(无法通过 BadGateway 响应将配置单元作业提交到集群)。我已经联系了支持团队，就我而言，问题出在头节点的内存泄漏，这意味着问题不在客户端，而且似乎是继承的hadoop问题。

我已经通过重新部署集群解决了这个问题。您是否尝试过提交其他工作(简单的工作)？如果是这样，我建议您与 azure 支持团队联系，或者重新部署集群(如果这对您来说不那么痛苦的话)。

关于c# - 提交 C# MapReduce 作业 Windows Azure HDInsight - 响应状态代码不表示成功 : 500 (Server Error)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/27390295/

26

4

0

文章推荐： hadoop - Spark 1.0.2(也是 1.1.0)卡在一个分区上

文章推荐： windows - Hook 特定进程的注册表访问的简单方法

文章推荐： java - Drools In Spark 流文件

c# - 应始终在导航到页面时加载 transient 状态，还是仅在从逻辑删除状态恢复时加载 transient 状态？
我正在通读 Windows Phone 7.5 Unleashed，有很多代码看起来像这样(在页面的代码隐藏中): bool loaded; protected override void OnNav
asp.net - 为什么我发送 201 状态，但在客户端收到 302 状态
在cgi服务器中，我这样返回 print ('Status: 201 Created') print ('Content-Type: text/html') print ('Location: htt
c - WSTOPSIG(状态) == 22 & WTERMSIG(状态) == 9;这些数字从何而来？
我正在查看 esh(easy shell)的实现，无法理解在这种情况下什么是 22 和 9 信号。理想情况下，有一个更具描述性的常量，但我找不到列表。最佳答案信号列表及其编号(包括您看到的这两个)
hadoop - Oozie Hive Action处于“准备”状态，作业处于“运行”状态
我的Oozie Hive Action 永远处于运行模式。 oozie.log文件中没有显示错误。
android - RFCOMM_CreateConnection - 已打开状态 :2, RFC 状态 :4, MCB 状态:5
我正在编写一个使用 RFCOMM 通过蓝牙连接到设备的 Android 应用程序。我使用 BluetoothChat 示例作为建立连接的基础，大部分时间一切正常。但是，有时由于出现套接字已打开的消息
firebase - Cloud Scheduler 作业命中 HTTPS 端点并记录失败(状态 502)，但服务器返回成功响应(状态 200)
我有一个云调度程序作业，它应该每小时访问我的 API 以更新一些价格。这些作业大约需要 80 秒才能运行。这是它的作用: POST https://www.example.com/api/jobs/
java - 我的 JSP 返回 202 (SC_ACCEPTED) 状态，但调用者获得 200 (SC_OK) 状态
我正在 Tomcat 上访问一个简单的 JSP 页面: 但是当我使用 curl 测试此页面时，我得到了 200 响应代码而不是预期的 202: $ curl -i "http://localhos
java - 具有 HTTP 状态 500 而不是 HTTP 状态 400 的 JAX-RS 响应
有时 JAR-RS 客户端会发送错误的语法请求正文。服务器应响应 HTTP status 400 (Bad Request) , 但它以 HTTP status 500 (Internal Serve
javascript - node-express 错误 : express deprecated res. 发送(状态) : Use res. 发送状态(状态)改为
我正在尝试通过 response.send() 发送一个整数，但我不断收到此错误 express deprecated res.send(status): Use res.sendStatus(sta
状态。如何将数据集转换为纯面板数据？
我已经用 Excel 和 Java 做过很多次了……这次我需要用 Stata 来做，因为保存变量更方便'labels .如何将 dataset_1 重组为下面的 dataset_2？我需要转换以下
数据库最佳实践 - 状态
我正在创建一个应用程序，其中的对象具有状态查找功能。为了提供一些上下文，让我们使用以下示例。帮助台应用程序，其中创建作业并通过以下工作流程移动: 新 - 工作已创建但未分配进行中 - 分配给工作人
Keras LSTM 状态
我想在 Keras 中运行 LSTM 并获得输出和状态。在 TF 中有这样的事情 with tf.variable_scope("RNN"): for time_step in range
Scala-GWT 状态
有谁知道 Scala-GWT 的当前状态项目？那里的主要作者 Grzegorz Kossakowski 似乎退出了这个项目，在 Spring 中从事 scalac 的工作。但是，在 interv
applescript - 访问内置电源管理器？状态
我正在尝试编写一个 super 简单的 applescript 来启动 OneDrive App , 或确保打开，当机器的电源设置为插入时，将退出，或确保关闭，当电源设置为电池时。我无法找到如何访问
angularjs - 单击链接时强制重新加载路线/状态
目前我正在做这样的事情 link.on('click', function () { if (link.attr('href') !== $route.current.originalPath
来自用户代理的 Javascript 状态
是否可以仅通过查看用户代理来检测浏览器上是否启用/禁用 Javascript。如果是，我应该寻找什么。如果否，检测用户浏览器是否启用/禁用 JavaScript 的最佳方法是什么最佳答案不，没有
Spring OSGi 状态
Spring 和 OSGi 目前的开发状况如何？最近好像有点安静了。文档的最新版本 ( http://docs.spring.io/osgi/ ) 来自 2009 年。我看到一些声明 Sprin
Java线程中断后处于 Activity 状态
我正在从主函数为此类创建一个线程，但即使使用 Thread.currentThread().interrupt() 中断它，输出仍然包含“Still Here”行。 public class Writ
Godog 在步骤之间传递参数/状态
为了满足并发要求，我想知道如何在 Godog 中的多个步骤之间传递参数或状态。 func FeatureContext(s *godog.Suite) { // This step is ca
ios - 如何获取子类中UIButton的默认突出显示颜色/状态？
我有一个UIButton子类，它不使用UIImage背景，仅使用背景色。我注意到的一件事是，当您设置按钮的背景图像时，有一个默认的突出显示状态，当按下按钮时，该按钮会稍微变暗。这是我当前的代码。

首页

博学

6Ren·AI

商城

c# - 提交 C# MapReduce 作业 Windows Azure HDInsight - 响应状态代码不表示成功 : 500 (Server Error)