gpt4 book ai didi

pivot - openrefine可以做汇总表吗?

转载 作者:行者123 更新时间:2023-12-02 20:41:19 31 4
gpt4 key购买 nike

我想知道是否可以像在 python 和 R 上那样在 OpenRefine 上创建值的聚合和汇总?示例:

包含 30 万条记录的医疗预约表身份识别患者 |年龄 |身份证预约 |值

患者汇总和总结的结果将是:身份识别患者 |上个时代 |平均值

我希望说得足够清楚,如果该功能在 Openrefine 上运行,那将会有很大的帮助。

最佳答案

答案是“是的,但是”...这是可能的,但有点复杂。让我们举个例子。

Id-patient,Age,Id-appointment,score
1,25,1-1,456
1,26,2-1,895
1,27,3-1,872
1,28,4-1,12
1,29,5-1,87
2,45,1-2,542
2,46,2-2,524
2,52,3-2,78
2,89,4-2,45
2,90,5-2,371

为了对每个患者进行聚合计算,您必须首先将每个患者转换为 record 。为此,请将“Id_ Patient”列移至开头并使用“blank down”(必须事先使用 "Sort..." and "Reoder rows permanently" 对 id 进行排序)。

之后,您可以对每条记录的所有值进行计算,将其视为数组。

通过截屏视频,所有这些都会更加清晰:

enter image description here

演示中使用的公式是:

GREL:

sort(row.record.cells.Age.value)[-1]

GREL:

sum(row.record.cells.score.value) / length(row.record.cells.score.value)

Python/Jython:

def avg(l):
return sum(l, 0.0) / len(l)

return avg([x for x in row['record']['cells']['score']['value']])

正如您所看到的,您可以使用 Open Refine 做很多事情,特别是使用 Pyhon/Jython。但计算并不是其主要目的。 Open Refine 的主要目的是探索、清理和丰富数据。它不是电子表格软件。您可以使用 Excel 中的数据透视表更轻松地完成同样的操作。就像您可以使用 Excel 清理一些困惑的数据一样,即使它不是最好的工具。

关于pivot - openrefine可以做汇总表吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46028789/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com