- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我有一个类似这样的RDD
color category
green a
green b
red a
orange a
green b
red d
green c
red d
green e
我正在尝试为每种颜色找到最常见的类别。像这样:
[green, b] : 2
[red, d ] : 2
[orange, a] : 1
使用后我已经完成了一半
rdd.countByValue()
在这种情况下会返回这样的字典:
(color=u'green', category=u'a'): 1
(color=u'green', category=u'b'): 2
(color=u'green', category=u'c'): 1
(color=u'green', category=u'e'): 1
(color=u'red', category=u'a'): 1
(color=u'red', category=u'd'): 2
(color=u'orange', category=u'a'): 1
从这一步我不知道如何获得每种颜色最常见的类别。提前致谢。
编辑:我正在尝试使用 contentDF.groupBy('color').agg({'category' : 'max'}).collect()
的不同方法,但我相信 agg
参数是错误的,因为它给出了整个表的总体最大值。有什么建议么?我觉得我越来越接近了!
编辑:我仍在寻找解决方案...现在我有一个这样的表:
color category frequency
green a 1
green b 2
green c 1
green e 1
red a 1
red d 2
orange a 1
谁能建议一个 Spark SQL 查询来选择每个颜色组的最大值?
最佳答案
你可以使用collections.defaultdict
:
import collections
with open("your_file") as f:
my_dict = collections.defaultdict(int)
next(f)
for x in f:
my_dict[x.strip()] +=1
print my_dict
关于python - 为每个变量找到最频繁的值(众数),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29474850/
例如,我有一个父类Author: class Author { String name static hasMany = [ fiction: Book,
代码如下: dojo.query(subNav.navClass).forEach(function(node, index, arr){ if(dojo.style(node, 'd
我有一个带有 Id 和姓名的学生表和一个带有 Id 和 friend Id 的 Friends 表。我想加入这两个表并找到学生的 friend 。 例如,Ashley 的 friend 是 Saman
我通过互联网浏览,但仍未找到问题的答案。应该很容易: class Parent { String name Child child } 当我有一个 child 对象时,如何获得它的 paren
我正在尝试创建一个以 Firebase 作为我的后端的社交应用。现在我正面临如何(在哪里?)找到 friend 功能的问题。 我有每个用户的邮件地址。 我可以访问用户的电话也预订。 在传统的后端中,我
我主要想澄清以下几点: 1。有人告诉我,在 iOS 5 及以下版本中,如果您使用 Game Center 设置多人游戏,则“查找 Facebook 好友”(如与好友争夺战)的功能不是内置的,因此您需要
关于redis docker镜像ENTRYPOINT脚本 docker-entrypoint.sh : #!/bin/sh set -e # first arg is `-f` or `--some-
我是一名优秀的程序员,十分优秀!