scala - 在完成 map 操作之前，Spark，mapPartitions，网络连接已关闭-6ren

scala - 在完成 map 操作之前，Spark，mapPartitions，网络连接已关闭

转载作者：行者123 更新时间：2023-12-03 00:14:55

26

4

我正在执行Spark作业，有时我想连接到 flex 搜索服务器以获取一些数据并将其添加到RDD。所以我正在使用的代码看起来像这样

 input.mapParitions(records=>{
  val elcon=new ElasticSearchConnection
  val client:TransportClient=elcon.openConnection()
 val newRecs=records.flatMap(record=>{
      val response = client.prepareGet("index" "indexType",
      record.id.toString).execute().actionGet()
       val newRec=processRec(record,reponse)
       newRec
   })//end of flatMap
   client.close()
   newRecs
 })//end of mapPartitions

我的问题是，在 client.close()操作完成之前调用了 flatMap命令，这当然会导致异常。如果我在flatMap内移动连接的生成和关闭，该代码将起作用，但这将生成大量连接。是否可以确保flatMap操作完成后将调用 client.close？

最佳答案

对RDD中的每个项目进行阻塞调用以获取相应的ElasticSearch文档，就是造成此问题的原因。通常建议避免阻塞 call 。

还有另一种使用ElasticSearch-for-Hadoop's Spark support的方法。

将ElasticSearch索引/类型读取为另一个RDD，并将其与RDD结合在一起。

包括正确的ESHadoop dependency版本。

import org.elasticsearch.spark._
val esRdd = sc.esRDD("index/indexType")   //This returns a pair RDD of (_id, Map of all key value pairs for all fields]
input.map(record => (record.id, record))  //Convert your RDD of records to a pair rdd of (id, record) as we want to join based on the id
input.join(esRdd).map(rec => processResponse(rec._2._1, rec._2._2)) // Join the two RDDs based on id column it returns a pair RDD with key=id & value=Pair of matching records (id,(inputrddrecord,esrddrecord))

希望这可以帮助。

PS:它仍然不能缓解缺乏同一地点的问题。 (即，每个带有_id的文档都将来自索引的不同分片)。更好的方法是在创建ES索引时实现输入RDD和ES索引文档的共置。

关于scala - 在完成 map 操作之前，Spark，mapPartitions，网络连接已关闭，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/37070375/

26

4

0

文章推荐： elasticsearch - Elasticsearch部落节点和Kibana-未知的主节点

文章推荐： python - 如何获取Elasticsearch for python中的所有热门内容？

文章推荐： ember.js - Elasticsearch和Ember Js

文章推荐： sql-server - 通过 Powershell 连接到 Azure SQL 数据库

javascript - 关闭 Canvas 导航默认打开/关闭
我正在使用的网站上有一个非 Canvas 导航。关闭 Canvas 导航的默认状态是关闭的，这在移动网站上运行良好，因为您可以打开它并选择您的链接，但在桌面上关闭它并打开它会隐藏用户的信息，我希望它是
swift - 关闭/关闭 NSViewController, macOS
我有一个 NSViewController 是这样连接的: 在底部 viewController 中，我尝试使用 self.dismiss(self) 关闭它，但是，它会产生此错误: [General
javascript - 展开搜索关闭单击“关闭 JQuery”
我昨天制作了一个扩展的 JQuery 搜索框，它的作用就像一个魅力!但是，我在创建一个脚本时遇到问题，当用户单击搜索框时，它会关闭。这是我的 JQuery: function expandSearc
javascript - 关闭 InfoWindow - 关闭 onclick - Google map
我一辈子都无法在 API V3 中一次只显示一个信息窗口。我需要一个在下一次开放之前关闭。还希望在 map 上的任何地方关闭 infoWindow onclick。这是否在初始化函数中？这是我的完整
c++ - Asio 端套接字函数 : cancel, 关闭、关闭、释放
关闭和清理套接字的正确方法是什么？我在辅助线程中运行 io_service，我需要关闭与主线程的连接: void closeConnection() { ioc.post([&socket]
java - 使用 Java + Selenium 关闭(关闭)Chrome 打印预览
我的 Selenium 测试看起来像这样:客户选择金融产品，填写一些必要的数据，并在打印预览中显示条款/协议(protocol)文档(根据本地法律的要求)。打印/关闭打印预览对话框后，客户输入更多数据
android - 将(打开/关闭)按钮添加到(打开/关闭)抽屉导航的 Activity
我目前正在从 android 网站了解 Navigation Drawer，我正在使用他们的示例 http://developer.android.com/training/implementing-
android - 无法在 Android 上启动项目 : Error running adb: adb: failed to run abb_exec. 错误:关闭 adb:写入连接错误:关闭
尝试通过 expo 在模拟器上运行 react-native 应用程序时出现此错误。 Couldn't start project on Android: Error running adb: adb
Javascript 关闭？
方法一 function transform(ar) { var alStr = []; for(var i=0; i
抽屉上的Android抽屉导航自定义图标打开/关闭
我想按以下方式自定义我的抽屉导航: 我希望在抽屉打开时显示一个图标，在抽屉关闭时显示另一个图标，而不是将菜单图标稍微向左滑动的当前默认动画。关于我在哪里可以找到类似内容的任何想法/线索？我做了一些
rest - 关闭 requestLog
我们刚刚从 0.6.2 或 0.7 升级了我们的 dropwizard 版本，发现 .yml 文件中的很多配置都发生了变化。尽管我们能够弄清楚其中的大部分，但我们无法弄清楚如何关闭“requestLo
django - celery 关闭
从 celery 2.4.5 升级后，我开始让 celery 随机关闭。我在 centOS 机器上使用 celery 3.0.12、boto 2.6 和 amazon sqs 和 django 1.
c - 为什么文件无法打开/关闭
我试图包含一些语句来指导用户更多地了解文件无法打开或关闭的原因。文件在写入模式下无法打开的一些可能情况是什么？无法关闭怎么办？ FILE *fp; if(!(fp = fopen("testing",
.net - 关闭.Net应用程序的应用程序设置上的DefaultSettingValueAttribute创建
我有一个DLL，可以访问数据库并从存储在配置文件中的应用程序设置中读取连接字符串。然后，引用此DLL的应用程序将需要在其配置文件中为此配置设置设置值。我遇到的问题是，生成的配置代码会通过Defaul
iphone - 关闭 UIDatePicker
我将 UIDatePicker 添加为 UITextField 的输入 View UIDatePicker *oBirth; NSDateFormatter *dateFormat; _edit
iphone - 关闭 UIImagePickerController
我有以下代码: SecondViewController *secondView = [[SecondViewController alloc] initWithNibName:@"SecondVie
c++ - 队列中的双端队列崩溃(关闭)
Closed. This question does not meet Stack Overflow guidelines。它当前不接受答案。想改善这个问题吗？更新问题，以便将其作为on-topic
macos - 拦截选项-关闭
通常，按下 option 键关闭窗口会关闭应用程序中的所有窗口。在我的应用程序中，我希望它仅关闭与用户正在关闭的窗口相关的窗口。我怎样才能做到这一点？我可以为所有窗口实现 windowShouldCl
cocoa - 关闭 NSWindow
我有一个 NSWindow，它托管一个已连接到脚本处理程序的 WebView。现在，当用户单击 WebView 上的控件上的按钮时，它会调用我的对象上的 Objective C 方法。在这种特定情
MacOS - 检测相机何时打开/关闭
我想根据 MBP 上的相机使用情况自动化个人工作流程。基本上我想知道是否任何的摄像头(内置或 USB)已打开或关闭，因此我可以运行我将创建的程序或脚本。我认为如果我需要轮询相机状态也可以，但基于

首页

博学

6Ren·AI

商城

scala - 在完成 map 操作之前，Spark，mapPartitions，网络连接已关闭