- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我有以下数据:
id hours class
1 67.91 V
1 65.56 V
1 51.14 V
1 41.51 V
1 33.55 V
1 26.45 G
1 26.09 V
1 25.77 G
1 25.50 P
1 25.13 G
1 24.49 P
1 21.88 B
1 18.57 V
1 17.90 B
...
18 92.2 B
18 81.06 V
18 70.48 V
18 67.10 B
18 62.92 B
18 62.88 V
18 54.36 B
18 52.77 V
18 44.55 V
18 40.61 P
18 40.51 P
18 40.06 V
18 37.67 V
18 33.78 B
我基本上需要以数据透视格式获取数据,并计算每个类(class)的总小时数占每个家庭总小时数的百分比数据:
预期输出:
id B G P V Total
1 8.44% 16.41% 10.60% 64.55% 100.00%
18 39.74% 0.0% 10.39% 49.87% 100.00%
有人可以帮我解决这个问题吗?这必须以 id/row 方式进行。数据位于 Pandas 数据框中。
最佳答案
我相信你需要groupby
+ 总和
+ unstack
或 pivot_table
旋转:
df = df.groupby(['id','class'])['hours'].sum().unstack(fill_value=0)
df = df.pivot_table(index='id', columns='class', values='hours', aggfunc='sum', fill_value=0)
然后除以div
每行总和,乘以 100
,round
最后通过 assign
添加新列 Total
检查是否得到 100
,谢谢 Paul H
想法:
df = df.div(df.sum(1), 0).mul(100).round(2).assign(Total=lambda df: df.sum(axis=1))
print (df)
class B G P V Total
id
1 8.44 16.41 10.60 64.55 100.0
18 39.74 0.00 10.39 49.87 100.0
然后将百分比转换为 string
并添加 %
:
df1 = df.astype(str) + '%'
print (df1)
class B G P V Total
id
1 8.44% 16.41% 10.6% 64.55% 100.0%
18 39.74% 0.0% 10.39% 49.87% 100.0%
时间:
np.random.seed(123)
N = 100000
L = list('BGPV')
df = pd.DataFrame({'class': np.random.choice(L, N),
'hours':np.random.rand(N),
'id':np.random.randint(20000, size=N)})
print (df)
def dark1(df):
ndf = df.groupby('id').apply(lambda x : x.groupby('class')['hours'].sum()/x['hours'].sum())\
.reset_index().pivot(columns='class',index='id')*100
return ndf.assign(Total=ndf.sum(1)).fillna(0)
def dark2(df):
one = df.groupby('id')['hours'].sum()
two = df.pivot_table(index='id',values='hours',columns='class',aggfunc=sum)
ndf = pd.DataFrame(two.values / one.values[:,None]*100,columns=two.columns)
return ndf.assign(Total=ndf.sum(1)).fillna(0)
def jez1(df):
df = df.groupby(['id','class'])['hours'].sum().unstack(fill_value=0)
return df.div(df.sum(1), 0).mul(100).assign(Total=lambda df: df.sum(axis=1))
def jez2(df):
df = df.pivot_table(index='id', columns='class', values='hours', aggfunc='sum', fill_value=0)
return df.div(df.sum(1), 0).mul(100).assign(Total=lambda df: df.sum(axis=1))
print (dark1(df))
print (dark2(df))
print (jez1(df))
print (jez2(df))
In [39]: %timeit (dark1(df))
1 loop, best of 3: 15.4 s per loop
In [40]: %timeit (dark2(df))
10 loops, best of 3: 52.7 ms per loop
In [41]: %timeit (jez1(df))
10 loops, best of 3: 38.8 ms per loop
In [42]: %timeit (jez2(df))
10 loops, best of 3: 44.9 ms per loop
警告
结果未解决给定组数的性能问题,这将影响其中一些解决方案的时间安排。
关于python - 如何在python中获取行基础行总计中每个值的百分比,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48109011/
我的函数概念上都返回相同的东西,但结果可以采用不同的形式: function GetThingy() 有四个不同的函数,每个可以返回不同的东西: 0.071(代表增长 7.1% 的 float 值)
这个问题在这里已经有了答案: Int division: Why is the result of 1/3 == 0? (19 个回答) 关闭 4 年前。 有什么方法可以计算(例如)120 的 50
我四处寻找这个,它看起来很简单,但我无法让它工作。 我有一张表格,其中一列需要格式化为百分比。下面是我的代码,但它没有格式化单元格,它只是将它们保留为小数。 我想这是因为 cell ,即使声明为范围,
我刚刚开始使用 WPF。从那以后,我开始关注造型系统。我来自 CSS 背景,我想以百分比设置边距。 当前值以像素为单位
我有一个表,其中每一行都有一个描述字段和一个 bool 值。我正在尝试编写一个查询,我可以在其中按每个相应的描述进行分组,并查看 bool 值为真的次数百分比。 示例表: PID Gen
我从文档中发现,考虑到 orientdb 100% 使用磁盘缓存,它使用的最大大小为 70% 用于读取缓存,30% 用于写入缓存 ( http://orientdb.com/docs/last/plo
有什么方法可以获取 docker 容器内部而不是外部的 cpu 百分比吗?! docker stats DOCKER_ID 显示的百分比正是我需要的,但我需要它作为变量。我需要获取容器本身内部的 cp
我正在尝试计算数据集每列中类别的比例(百分比)。 示例数据: df <- data.frame( "Size" = c("Y","N","N","Y","Y"), "Type" =
我应该使用小数还是 float 在数据库中存储比率?特别是在 SQL2005 中。 最佳答案 这取决于您对准确性的需求。如果您可以容忍来自存储 float 的 IEEE 方法的典型错误,则使用 flo
我正在创建一个游戏,目前必须处理一些math.random问题。 我的Lua能力不是那么强,你觉得怎么样 您能制定一个使用 math.random 和给定百分比的算法吗? 我的意思是这样的函数: fu
如何在SQL中动态计算百分比? 假设您有一个名为 Classes 的下表: ClassSession StudentName -------------------------------
如何通过 jQuery 创建具有百分比的数字掩码输入?我是否让输入仅接受三个数字,并在用户完成输入时在数字后添加百分号(keyup)? 我不使用插件。 示例:1% 或 30% 或 99% 或 100%
我正在尝试构建一个工具,可以突出显示具有最高介数中心性的社交网络节点。我将所有网络节点的测量值计算到字典中,按顺序对字典进行排序,然后仅保留前 3 对。 我希望这个工具是可扩展的,所以我想保留前 10
MYSQL 中的人员如何将一个日期条目和分数的用户百分比与另一个日期条目和分数进行比较,从而有效地返回从一个日期到另一个日期的用户百分比增加情况? 几天来我一直在试图解决这个问题,但我已经没有想法了,
我需要进行查询,结果是百分比。 我现在的查询如下所示: select COUNT(CREATE_WEEKDAY), CREATE_WEEKDAY, COUNT(CREATE
我有一个图像上传功能,其工作原理如下: $('.update-insertimage-form').submit(function() { $(".submit-newupdate-btn").add
我的问题很简单,但我仍然找不到这个问题的答案... 假设我们有两个包含图像的容器。 我们有类似的东西 #containera { width: 50%; height: 50%; backgr
是否可以将 CSS 尺寸指定为除其父元素之外的另一个元素的百分比?例如,我想将 div 的 border-radius 指定为 div 宽度的 10%。但是,border-radius: 10% 在
我正在尝试设置按钮的大小并以百分比进行编辑 但是这个的线性大小是不同的。为什么? 最佳答案 您好,问题出在属性 box-sizing 上.默认为 input type
我将它用于我的页眉,该页眉在一页上下滚动页面中发生变化。我注意到它没有响应,所以我想问你是否知道一种使它响应的方法。就像将 0-690 更改为百分比,以便它可以在移动设备和电视屏幕上使用。 HTML
我是一名优秀的程序员,十分优秀!