- ubuntu12.04环境下使用kvm ioctl接口实现最简单的虚拟机
- Ubuntu 通过无线网络安装Ubuntu Server启动系统后连接无线网络的方法
- 在Ubuntu上搭建网桥的方法
- ubuntu 虚拟机上网方式及相关配置详解
CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.
这篇CFSDN的博客文章详解Python中的分组函数groupby和itertools)由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.
具体代码如下所示:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
|
from
operator
import
itemgetter
#itemgetter用来去dict中的key,省去了使用lambda函数
from
itertools
import
groupby
#itertool还包含有其他很多函数,比如将多个list联合起来。。
d1
=
{
'name'
:
'zhangsan'
,
'age'
:
20
,
'country'
:
'China'
}
d2
=
{
'name'
:
'wangwu'
,
'age'
:
19
,
'country'
:
'USA'
}
d3
=
{
'name'
:
'lisi'
,
'age'
:
22
,
'country'
:
'JP'
}
d4
=
{
'name'
:
'zhaoliu'
,
'age'
:
22
,
'country'
:
'USA'
}
d5
=
{
'name'
:
'pengqi'
,
'age'
:
22
,
'country'
:
'USA'
}
d6
=
{
'name'
:
'lijiu'
,
'age'
:
22
,
'country'
:
'China'
}
lst
=
[d1,d2,d3,d4,d5,d6]
#通过country进行分组:
lst.sort(key
=
itemgetter(
'country'
))
#需要先排序,然后才能groupby。lst排序后自身被改变
lstg
=
groupby(lst,itemgetter(
'country'
))
#lstg = groupby(lst,key=lambda x:x['country']) 等同于使用itemgetter()
for
key,group
in
lstg:
for
g
in
group:
#group是一个迭代器,包含了所有的分组列表
print
key,g
|
返回:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
|
China {
'country'
:
'China'
,
'age'
:
20
,
'name'
:
'zhangsan'
}
China {
'country'
:
'China'
,
'age'
:
22
,
'name'
:
'lijiu'
}
JP {
'country'
:
'JP'
,
'age'
:
22
,
'name'
:
'lisi'
}
USA {
'country'
:
'USA'
,
'age'
:
19
,
'name'
:
'wangwu'
}
USA {
'country'
:
'USA'
,
'age'
:
22
,
'name'
:
'zhaoliu'
}
USA {
'country'
:
'USA'
,
'age'
:
22
,
'name'
:
'pengqi'
}
print
[key
for
key,group
in
lstg]
#返回:['China', 'JP', 'USA']
print
[(key,
list
(group))
for
key,group
in
lstg]
#返回的list中包含着三个元组:
[(
'China'
, [{
'country'
:
'China'
,
'age'
:
20
,
'name'
:
'zhangsan'
}, {
'country'
:
'China'
,
'age'
:
22
,
'name'
:
'lijiu'
}]), (
'JP'
, [{
'country'
:
'JP'
,
'age'
:
22
,
'name'
:
'lisi'
}]), (
'USA'
, [{
'country'
:
'USA'
,
'age'
:
19
,
'name'
:
'wangwu'
}, {
'country'
:
'USA'
,
'age'
:
22
,
'name'
:
'zhaoliu'
}, {
'country'
:
'USA'
,
'age'
:
22
,
'name'
:
'pengqi'
}])]
print
dict
([(key,
list
(group))
for
key,group
in
lstg])
#返回的是一个字典:
{
'JP'
: [{
'country'
:
'JP'
,
'age'
:
22
,
'name'
:
'lisi'
}],
'China'
: [{
'country'
:
'China'
,
'age'
:
20
,
'name'
:
'zhangsan'
}, {
'country'
:
'China'
,
'age'
:
22
,
'name'
:
'lijiu'
}],
'USA'
: [{
'country'
:
'USA'
,
'age'
:
19
,
'name'
:
'wangwu'
}, {
'country'
:
'USA'
,
'age'
:
22
,
'name'
:
'zhaoliu'
}, {
'country'
:
'USA'
,
'age'
:
22
,
'name'
:
'pengqi'
}]}
print
dict
([(key,
len
(
list
(group)))
for
key,group
in
lstg])
#返回每个分组的个数:
{
'JP'
:
1
,
'China'
:
2
,
'USA'
:
3
}
#返回包含有2个以上元素的分组
print
[key
for
key,group
in
groupby(
sorted
(lst,key
=
itemgetter(
'country'
)),itemgetter(
'country'
))
if
len
(
list
(group))>
=
2
]
#返回:['China', 'USA']
lstg
=
groupby(
sorted
(lst,key
=
itemgetter(
'country'
)),key
=
itemgetter(
'country'
))
lstgall
=
[(key,
list
(group))
for
key,group
in
lstg ]
print
dict
(
filter
(
lambda
x:
len
(x[
1
])>
2
,lstgall))
#过滤出分组后的元素个数大于2个的分组,返回:
{
'USA'
: [{
'country'
:
'USA'
,
'age'
:
19
,
'name'
:
'wangwu'
}, {
'country'
:
'USA'
,
'age'
:
22
,
'name'
:
'zhaoliu'
}, {
'country'
:
'USA'
,
'age'
:
22
,
'name'
:
'pengqi'
}]}
|
自定义分组:
1
2
3
4
5
6
7
8
9
10
|
from
itertools
import
groupby
lst
=
[
2
,
8
,
11
,
25
,
43
,
6
,
9
,
29
,
51
,
66
]
def
gb(num):
if
num <
=
10
:
return
'less'
elif
num >
=
30
:
return
'great'
else
:
return
'middle'
print
[(k,
list
(g))
for
k,g
in
groupby(
sorted
(lst),key
=
gb)]
|
返回:
1
|
[(
'less'
, [
2
,
6
,
8
,
9
]), (
'middle'
, [
11
,
25
,
29
]), (
'great'
, [
43
,
51
,
66
])]
|
总结 。
以上所述是小编给大家介绍的Python中的分组函数groupby和itertools),希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对我网站的支持! 。
原文链接:https://www.cnblogs.com/dreamer-fish/p/5522687.html 。
最后此篇关于详解Python中的分组函数groupby和itertools)的文章就讲到这里了,如果你想了解更多关于详解Python中的分组函数groupby和itertools)的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。
itertools.repeat(n) 和 itertools.cycle(n) 有区别吗?看起来,它们产生相同的输出。在我需要某个元素的无限循环的情况下,使用一种更有效吗? 最佳答案 简单地说,it
在编写一个查找列表中所有不同组合的程序时,我发现了很多关于使用 intertools.product() 而不是 intertools.combinations_with_replacement()
这段代码: from itertools import groupby, count L = [38, 98, 110, 111, 112, 120, 121, 898] groups = group
我正在读取一个文件(同时执行一些昂贵的逻辑),我需要在不同的函数中迭代多次,所以我真的只想读取和解析文件一次。 解析函数解析文件并返回一个itertools.groupby对象。 def parse_
下面是一些关于itertools.tee的测试: li = [x for x in range(10)] ite = iter(li) ========================
为什么下面的工作: from itertools import chain 但下面的不是吗? import itertools.chain as chain 最佳答案 import foo.bar 语
我必须在列表中生成所有 2 对项目组合。现在,我知道有两种方法可以实现此目的:嵌套 for 循环和 python 的内置 itertools: from itertools import combin
给定 r 为 4 的 itertools 组合: from itertools import combinations mylist = range(0,35) r = 4 combinationsl
我有一个列表 = [1, 2, 3, 3, 6, 8, 8, 10, 2, 5, 7, 7]我正在尝试使用 groupby 将其转换为 1 2 3 3 6 8,8 10 2, 5 7,7 基本上,任何
我正在使用itertools对字典键进行分组,使用以下内容: host_data = [] for k,v in itertools.groupby(temp_data, key=lambda x:x
我将自定义函数保存在一个单独的模块中,以便在需要时调用。我的一个新函数使用 itertools,但我不断收到名称错误。 NameError: name 'itertools' is not defin
我有一个简单的 python 函数来执行 itertools 乘积函数。如下所示。 def cart(n, seq): import itertools b = 8 while
我正在创建大量带有替换(乘积)的排列,它需要大量的计算时间。让我们使用像这样的简单函数: def permutations(li): return [p for p in itertools.
我编写了以下代码,使所有 20 个字符长的字符串都包含 A、T、G 和 C 的组合。 但是,我想避免连续出现 3 个以上的相同字符,因此我添加了一个 if 函数来检查这一点。问题是,这是在 itert
我想要一个函数来生成任意数量的数组的叉积。 # Code to generate cross product of 3 arrays M = [1, 1] N = [2, 3] K = [4, 5]
这个问题已经有答案了: Cartesian Product of Sets where No Elements are Identical under Permutations in Python (
我使用 for num in Combinations(nums[0], number): 返回列表中数字的所有组合,其中 num = len(nums[0])- 1.. 我想做的是作为单独的变量返回
我想将 itertools.count 元素作为列表索引传递,但会导致以下错误: TypeError: list indices must be integers or slices, not ite
有没有更好的方法来列出所有可能的组合,并用每个元素的最小和最大出现次数进行替换,而不是(1)使用itertools.combinations_with_replacement()列出所有可能的组合,而
关闭。此题需要details or clarity 。目前不接受答案。 想要改进这个问题吗?通过 editing this post 添加详细信息并澄清问题. 已关闭 6 年前。 Improve th
我是一名优秀的程序员,十分优秀!