gpt4 book ai didi

data-manipulation - 在 OpenRefine 中合并列 x 到 n

转载 作者:行者123 更新时间:2023-12-04 07:48:33 24 4
gpt4 key购买 nike

我有一个列数未知的表,我需要在某个点之后组合所有列。考虑以下:

| A  | B  | C | D | E |
|----|----|---|---|---|
| 24 | 25 | 7 | | |
| 12 | 3 | 4 | | |
| 5 | 5 | 5 | 5 | |

A-C 列是已知的,并且其中的信息是正确的。但是列 D 到 N(以 D 开头的未知列数)需要组合,因为它们都是同一字符串的一部分。如何在 OpenRefine 中组合未知数量的列?

由于某些列可能有空单元格(字符串可能有各种长度),我还需要忽略空单元格。

最佳答案

有一个两步走的方法应该适合你。

从要合并的第一列(在本例中为 Col D)选择 Transpose->Transpose cells between columns into rows

您将被要求设置一些选项。您需要选择“从列”D 和“到列”N。然后选择转置为一列,为该列指定一个名称,确保选中“忽略空白单元格”选项(应通过默认。然后单击转置。

您将获得以前出现在列 D-N 中的值出现在行中。例如

| A  | B  | C | D | E | F |
|----|----|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 |

转置为:
| A  | B  | C | new |
|----|----|---|-----|
| 1 | 2 | 3 | 4 |
| | | | 5 |
| | | | 6 |

然后,您可以使用"new"列顶部的下拉菜单进行选择
编辑单元格->加入多值单元格

系统会询问您要使用什么字符来分隔连接单元格中的字符。可能在您的用例中,您可以删除连接字符并在没有任何连接字符的情况下组合单元格。这会给你:
| A  | B  | C | new |
|----|----|---|-----|
| 1 | 2 | 3 | 456 |

关于data-manipulation - 在 OpenRefine 中合并列 x 到 n,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31767539/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com