python - 为每个变量找到最频繁的值(众数)-6ren

python - 为每个变量找到最频繁的值(众数)

转载作者：太空宇宙更新时间：2023-11-04 05:52:28

25

4

我有一个类似这样的RDD

color  category
green  a
green  b
red    a
orange a
green  b
red    d
green  c
red    d
green  e

我正在尝试为每种颜色找到最常见的类别。像这样:

[green, b]  : 2
[red, d ]   : 2
[orange, a] : 1

使用后我已经完成了一半

rdd.countByValue()

在这种情况下会返回这样的字典:

(color=u'green', category=u'a'): 1
(color=u'green', category=u'b'): 2
(color=u'green', category=u'c'): 1
(color=u'green', category=u'e'): 1
(color=u'red', category=u'a'): 1
(color=u'red', category=u'd'): 2
(color=u'orange', category=u'a'): 1

从这一步我不知道如何获得每种颜色最常见的类别。提前致谢。

编辑:我正在尝试使用 contentDF.groupBy('color').agg({'category' : 'max'}).collect() 的不同方法，但我相信 agg 参数是错误的，因为它给出了整个表的总体最大值。有什么建议么？我觉得我越来越接近了!

编辑:我仍在寻找解决方案...现在我有一个这样的表:

 color category frequency
 green   a         1
 green   b         2
 green   c         1
 green   e         1
 red     a         1
 red     d         2
 orange  a         1

谁能建议一个 Spark SQL 查询来选择每个颜色组的最大值？

最佳答案

你可以使用collections.defaultdict:

import collections
with open("your_file") as f:
    my_dict = collections.defaultdict(int)
    next(f)
    for x in f:
        my_dict[x.strip()] +=1
    print my_dict

关于python - 为每个变量找到最频繁的值(众数)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/29474850/

25

4

0

文章推荐： python - Requests.package.urllib3 错误

文章推荐： c - 如何将 64 字节字符串转换为 20 字节字符串？

文章推荐： c - 过滤一个缓冲区并将其复制到另一个 C

文章推荐： python - print_parts() 函数在编写程序中的工作原理 chapter2.3

grails - Cereal ，哥伦。按 parent 找 child ，按 child 找 parent
例如，我有一个父类Author: class Author { String name static hasMany = [ fiction: Book,
javascript - DOJO:找 child
代码如下: dojo.query(subNav.navClass).forEach(function(node, index, arr){ if(dojo.style(node, 'd
mysql - 加入两张 table 找 friend
我有一个带有 Id 和姓名的学生表和一个带有 Id 和 friend Id 的 Friends 表。我想加入这两个表并找到学生的 friend 。例如，Ashley 的 friend 是 Saman
grails - Grails按 child 找 parent
我通过互联网浏览，但仍未找到问题的答案。应该很容易: class Parent { String name Child child } 当我有一个 child 对象时，如何获得它的 paren
android - Firebase Android 找 friend 功能
我正在尝试创建一个以 Firebase 作为我的后端的社交应用。现在我正面临如何(在哪里？)找到 friend 功能的问题。我有每个用户的邮件地址。我可以访问用户的电话也预订。在传统的后端中，我
ios - Apple Game Center 和 Facebook 找 friend iOS6
我主要想澄清以下几点: 1。有人告诉我，在 iOS 5 及以下版本中，如果您使用 Game Center 设置多人游戏，则“查找 Facebook 好友”(如与好友争夺战)的功能不是内置的，因此您需要
docker - 有什么用!意思？找。\! -用户redis -exec chown redis '{}' +
关于redis docker镜像ENTRYPOINT脚本 docker-entrypoint.sh : #!/bin/sh set -e # first arg is `-f` or `--some-

首页

博学

6Ren·AI

商城

python - 为每个变量找到最频繁的值(众数)