- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我在 Spark GraphX 中使用 Pregel 编写了我的算法。但不幸的是我得到 TypeMismatch 错误。
我加载图表:val my_graph= GraphLoader.edgeListFile(sc, path)
.所以一开始节点有一个结构,例如:
(1,1)
(2,1)
(3,1)
以 nodeID 作为键,1 是其默认属性。
run2
函数,首先我更改结构以创建一个结构,以便每个节点可以存储多个属性。因为我正在研究重叠社区检测算法,所以属性是标签及其分数。
run2
的第一次运行,每个节点都有一个结构,例如:
(34,Map(34 -> (1.0,34)))
(13,Map(13 -> (1.0,13)))
(4,Map(4 -> (1.0,4)))
(16,Map(16 -> (1.0,16)))
(22,Map(22 -> (1.0,22)))
这意味着节点 34 具有标签 34 并且其分数等于 1。然后每个节点可以存储从其邻居接收的多个属性,并在接下来的步骤中可以将它们发送给其邻居。
(1,Map((2->(0.49,1),(8->(0.9,1)),(13->(0.79,1))))
(2,Map((11->(0.89,2)),(6->(0.68,2)),(13->(0.79,2)),(10->(0.57,2))))
(3,Map((20->(0.0.8,3)),(1->(0.66,3))))
上面的结构显示,例如,节点 1 属于社区 2,得分为 0.49,属于社区 8,得分为 0.9,属于社区 13,得分为 0.79。
def run2[VD, ED: ClassTag](graph: Graph[VD, ED], maxSteps: Int) = {
val temp_graph = graph.mapVertices { case (vid, _) => mutable.HashMap[VertexId, (Double,VertexId)](vid -> (1,vid)) }
def sendMessage(e: EdgeTriplet[mutable.HashMap[VertexId, (Double,VertexId)], ED]): Iterator[(VertexId, mutable.HashMap[VertexId, (Double, VertexId)])] = {
Iterator((e.srcId,e.dstAttr), (e.dstId,e.srcAttr))
}
def mergeMessage(count1: (mutable.HashMap[VertexId, (Double,VertexId)]), count2: (mutable.HashMap[VertexId, (Double,VertexId)]))= {
val communityMap = new mutable.HashMap[VertexId, List[(Double, VertexId)]]
(count1.keySet ++ count2.keySet).map(key => {
val count1Val = count1.getOrElse(key, (0D,0:VertexId))
val count2Val = count2.getOrElse(key, (0D,0:VertexId))
communityMap += key->(count1Val::communityMap(key))
communityMap += key->(count2Val::communityMap(key))
})
communityMap
}
def vertexProgram(vid: VertexId, attr: mutable.HashMap[VertexId,(Double, VertexId)], message: mutable.HashMap[VertexId, List[(Double, VertexId)]]) = {
if (message.isEmpty)
attr
else {
val labels_score: mutable.HashMap[VertexId, Double] = message.map {
key =>
var value_sum = 0D
var isMemberFlag = 0
var maxSimilar_result = 0D
val max_similar = most_similar.filter(x=>x._1==vid)(1)
if (key._2.exists(x=>x._2==max_similar)) isMemberFlag = 1 else isMemberFlag = 0
key._2.map {
values =>
if (values._2==max_similar) maxSimilar_result = values._1 else maxSimilar_result = 0D
val temp = broadcastVariable.value(vid)(values._2)._2
value_sum += values._1 * temp
}
value_sum += (beta*value_sum)+((1-beta)*maxSimilar_result)
(key._1,value_sum) //label list
}
val max_value = labels_score.maxBy(x=>x._2)._2.toDouble
val dividedByMax = labels_score.map(x=>(x._1,x._2/max_value)) // divide by maximum value
val resultMap: mutable.HashMap[VertexId,Double] = new mutable.HashMap[VertexId, Double]
dividedByMax.foreach{ row => // select labels more than threshold P = 0.5
if (row._2 >= p) resultMap += row
}
val max_for_normalize= resultMap.values.sum
val res = resultMap.map(x=>(x._1->(x._2/max_for_normalize,x._1))) // Normalize labels
res
}
}
val initialMessage = mutable.HashMap[VertexId, (Double,VertexId)]()
val overlapCommunitiesGraph = Pregel(temp_graph, initialMessage, maxIterations = maxSteps)(
vprog = vertexProgram,
sendMsg = sendMessage,
mergeMsg = mergeMessage)
overlapCommunitiesGraph
}
val my_graph= GraphLoader.edgeListFile(sc, path)
val new_updated_graph2 = run2(my_graph, 1)
在上面的代码中,
p=0.5
和
beta=0.5
.
most_similar
是一个包含每个节点及其最重要节点的 RDD。例如
(1,3)
表示节点 3 是节点 1 最相似的邻居。
broadcatVariable
结构如下:
(19,Map(33 -> (1.399158675718661,0.6335049099178383), 34 -> (1.4267350687130098,0.6427405501408145)))
(15,Map(33 -> (1.399158675718661,0.6335049099178383), 34 -> (1.4267350687130098,0.6427405501408145)))
...
该结构显示一个节点作为键和它的邻居作为值之间的关系。例如,节点 19 与节点 33 和 34 是邻居,关系由它们之间的分数表示。
Map
包含多个标签及其分数。然后在
mergeMessage
函数,将相同编号的标签的值放入
List
并在
vertexProgram
对于每个标签或键,处理其列表。
List
收集标签的不同分数并在
vertexProgram
中处理它们功能。因为我需要
P_ji
用于处理每个节点的标签分数,所以不知道是否可以在
mergeMessage
中执行函数或是否需要在
vertexProgram
.
P_ji
是源节点与其邻居之间的分数,应乘以标签分数。
vprog = vertexProgram,
行的前面并显示在这张图片中。任何人都可以通过解决此错误来帮助我吗?
最佳答案
主要问题是您对消息使用了两种不同的类型。初始消息的类型为 mutable.HashMap[VertexId, (Double,VertexId)]
但合并两个(使用 mergeMessage
函数)后,类型变为 mutable.HashMap[VertexId, List[(Double,VertexId)]]
.这里的问题是,由于类型错误,现在合并的消息无法与另一条消息合并。
有两种方法可以解决这个问题:
mutable.HashMap[VertexId, List[(Double,VertexId)]]
,确保初始消息与此匹配。 mutable.HashMap[VertexId, (Double,VertexId)]
并更改 mergeMessage
的输出类型匹配。 sendMessage
,
mergeMessage
和
initialMessage
处理列表。这可以按如下方式完成:
def sendMessage(e: EdgeTriplet[Map[VertexId, (Double,VertexId)], ED]): Iterator[(VertexId, Map[VertexId, List[(Double, VertexId)]])] = {
val msg1 = e.dstAttr.map{ case (k,v) => (k, List(v)) }
val msg2 = e.srcAttr.map{ case (k,v) => (k, List(v)) }
Iterator((e.srcId, msg1), (e.dstId, msg2))
}
def mergeMessage(count1: Map[VertexId, List[(Double,VertexId)]], count2: Map[VertexId, List[(Double,VertexId)]])= {
val merged = count1.toSeq ++ count2.toSeq
val new_message = merged.groupBy(_._1).map{case (k,v) => (k, v.map(_._2).flatten.toList)}
new_message
}
val initialMessage = Map[VertexId, List[(Double,VertexId)]]()
可能是
messages.isEmpty
返回
vertexProgram
也需要调整。
vertexProgram
移开。至
mergeMessage
.我稍微简化了代码,因此代码可能需要一些测试。
def mergeMessage(count1: (Map[VertexId, (Double, VertexId)]), count2: (Map[VertexId, (Double, VertexId)]))= {
val merged = count1.toSeq ++ count2.toSeq
val grouped = merged.groupBy(_._1)
val new_message = grouped.map{ case (key, key_values) =>
val values = key_values.map(_._2)
val max_similar = most_similar.filter(x => x._1 == key).headOption match {
case Some(x) => x
case _ => -1 // What should happen when there is no match?
}
val maxSimilar_result = values.filter(v => v._2 == max_similar).headOption match {
case Some(x) => x._1
case _ => 0.0
}
val value_sum = values.map{ v => v._1 * broadcastVariable.value(key)(v._2)._2}.sum
val res = (beta*value_sum)+((1-beta)*maxSimilar_result)
(key, (res, key))
}
new_message.toMap
}
def vertexProgram(vid: VertexId, attr: Map[VertexId, (Double, VertexId)], messages: Map[VertexId, (Double, VertexId)]) = {
if (messages.isEmpty){
attr
} else {
val labels_score = messages.map(m => (m._1, m._2._1))
val max_value = labels_score.maxBy(x => x._2)._2.toDouble
val dividedByMax = labels_score.map(x => (x._1, x._2 / max_value)) // divide by maximum value
// select labels more than threshold P = 0.5
val resultMap = dividedByMax.filter{ row => row._2 >= p }
val max_for_normalize= resultMap.values.sum
val res = resultMap.map(x => (x._1 -> (x._2 / max_for_normalize, x._1))) // Normalize labels
res
}
}
备注 :
sendMessage
,一条消息被发送到两个节点,而与图边的方向无关。如果这是正确的取决于想要的逻辑。 mutable.HashMap
到正常(不可变)Map
.如果可能,总是首选使用不可变选项。 vertexProgram
中的逻辑相当复杂。还有一些变量目前没有做任何事情,但也许以后会使用它们。如果无法以迭代方式合并消息(并且您需要一次查看所有消息),则使用 List
将是要走的路。 关于scala - 为什么在 Spark GraphX 中执行 Pregel 时出现 TypeMismatch 错误?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63352562/
我有一个“有趣”的问题,即以两种不同的方式运行 wine 会导致: $> wine --version /Applications/Wine.app/Contents/Resources/bin/wi
我制作了这个网络抓取工具来获取网页中的表格。我使用 puppeteer (不知道 crontab 有问题)、Python 进行清理并处理数据库的输出 但令我惊讶的是,当我执行它时 */50 * * *
JavaScript 是否被调用或执行取决于什么?准确地说,我有两个函数,它们都以相同的方式调用: [self.mapView stringByEvaluatingJavaScriptFromStri
我目前正在使用 python 做一个机器学习项目(这里是初学者,从头开始学习一切)。 只是想知道 statsmodels 的 OLS 和 scikit 的 PooledOlS 使用我拥有的相同面板数据
在使用集成对象模型 (IOM) 后,我可以执行 SAS 代码并将 SAS 数据集读入 .Net/C# 数据集 here . 只是好奇,使用 .Net 作为 SAS 服务器的客户端与使用 Enterpr
有一些直接的 jQuery 在单击时隐藏打开的 div 未显示,但仍将高度添加到导航中以使其看起来好像要掉下来了。 这个脚本工作正常: $(document).ready(funct
这个问题已经有答案了: How do I compare strings in Java? (23 个回答) 已关闭 4 年前。 这里是 Java 新手,我正在使用 NetBeans 尝试一些简单的代
如果我将它切换到 Python 2.x,它执行 10。这是为什么? 训练逻辑回归模型 import keras.backend as
我有两个脚本,它们包含在 HTML 正文中。在第一个脚本中,我初始化一个 JS 对象,该对象在第二个脚本标记中引用。 ... obj.a = 1000; obj.
每当我运行该方法时,我都会收到一个带有数字的错误 以下是我的代码。 public String getAccount() { String s = "Listing the accounts";
我已经用 do~while(true) 创建了我的菜单;但是每次用户输入一个数字时,它不会运行程序,而是再次显示菜单!你怎么看? //我的主要方法 public static void main(St
执行命令后,如何让IPython通知我?我可以使用铃声/警报还是通过弹出窗口获取它?我正在OS X 10.8.5的iTerm上运行Anaconda。 最佳答案 使用最新版本的iTerm,您可以在she
您好,我刚刚使用菜单栏为 Swing 编写了代码。但是问题出现在运行中。我输入: javac Menu.java java Menu 它没有给出任何错误,但 GUI 没有显示。这是我的源代码以供引用:
我觉得这里缺少明显的东西,但是我看不到它写在任何地方。 我使用Authenticode证书对可执行文件进行签名,但是当我开始学习有关它的更多信息时,我对原样的值(value)提出了质疑。 签名的exe
我正在设计一个应用程序,它使用 DataTables 中的预定义库来创建数据表。我想对数据表执行删除操作,为此应在按钮单击事件上执行 java 脚本。 $(document).ready(functi
我是 Haskell 新手,如果有人愿意帮助我,我会很高兴!我试图让这个程序与 do while 循环一起工作。 第二个 getLine 命令的结果被放入变量 goGlenn 中,如果 goGlenn
我有一个用 swing 实现迷你游戏的程序,在主类中我有一个循环,用于监听游戏 map 中的 boolean 值。使用 while 实现的循环不会执行一条指令,如果它是唯一的一条指令,我不知道为什么。
我正在尝试开发一个连接到 Oracle 数据库并执行函数的 Java 应用程序。如果我在 Eclipse 中运行该应用程序,它可以工作,但是当我尝试在 Windows 命令提示符中运行 .jar 时,
我正在阅读有关 Java 中的 Future 和 javascript 中的 Promises 的内容。下面是我作为示例编写的代码。我的问题是分配给 future 的任务什么时候开始执行? 当如下行创
我有一个常见的情况,您有两个变量(xSpeed 和 ySpeed),当它们低于 minSpeed 时,我想将它们独立设置为零,并在它们都为零时退出。 最有效的方法是什么?目前我有两种方法(方法2更干净
我是一名优秀的程序员,十分优秀!