- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
如何从 df 转到 df1,其中 df 和 df1 如下所示?
df = koalas.DataFrame({"teams": [["SF", "NYG"] for _ in range(7)],'teams1':[np.random.randint(0,10) for _ in range(7)]})
df
output:
teams teams1
0 [SF, NYG] 0
1 [SF, NYG] 5
2 [SF, NYG] 8
3 [SF, NYG] 1
4 [SF, NYG] 2
5 [SF, NYG] 8
6 [SF, NYG] 5
df1 = koalas.DataFrame({"col1": ["SF" for _ in range(7)],\
"col2": ["NYG" for _ in range(7)],\
'teams1':[np.random.randint(0,10) for _ in range(7)]})
df1
output:
col1 col2 teams1
0 SF NYG 8
1 SF NYG 2
2 SF NYG 9
3 SF NYG 4
4 SF NYG 8
5 SF NYG 3
6 SF NYG 1
我可以看到 Pandas 的解决方案 here .但是这个解决方案将收集司机端的所有数据,这不是我想要的。我想要一个考拉(pyspark 上的 Pandas )解决方案
最佳答案
我发现仅使用对 worker 操作的函数并且不将所有数据收集到驱动程序的一种方法是
df['teams'] \
.astype(str) \
.str.replace('\[|\]', '') \
.str.split(pat=',', n=1, expand=True)
# 0 1
# 0 SF NYG
# 1 SF NYG
# 2 SF NYG
# 3 SF NYG
# 4 SF NYG
# 5 SF NYG
# 6 SF NYG
我必须将该列转换为 string 类型,因为它是一个 numpy 数组,而 pyspark 无法对其进行操作。
要获取初始数据框及其其他列,您可以使用简单的concat
:
import databricks.koalas as ks
ks.concat([
df['teams'].astype(str).str.replace('\[|\]', '').str.split(pat=',', n=1, expand=True),
df.drop(columns='teams')
], axis=1)
# 0 1 teams1
# 0 SF NYG 2
# 1 SF NYG 2
# 2 SF NYG 1
# 3 SF NYG 1
# 4 SF NYG 7
# 5 SF NYG 8
# 6 SF NYG 6
关于python - 将列表的 koalas 列拆分为多列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/70361477/
如何从 df 转到 df1,其中 df 和 df1 如下所示? df = koalas.DataFrame({"teams": [["SF", "NYG"] for _ in range(7)],'t
我正在使用 C++ graph library KOALA计算图的最小割。 这是我正在使用的示例 - example .它只是创建一个边上有容量的图并计算最小割。 我的问题与这一行有关: Flow::
我刚刚在我的 Ubuntu 12.04 系统上安装了 Koala。当我尝试编译我的 .scss 文件时,我收到以下错误消息: /home/tylerschade/loancalculator/styl
对于大型数据集,koalas.head(n) 函数需要很长时间。我知道它试图带回驱动程序节点中的所有数据,然后呈现绝对前 n 行。 有没有什么快速的方法可以分析 koalas 中的前 n 行,以便只涉
我正在使用 Koala for Win64 将 sass(有很多部分)编译为 css 没有问题,但是 Koala 自动编译功能仅在根 scss 文件中有更新时才运行,所以我需要打开 Koala 并按“
我已经有用户使用它的 facebook 应用程序。我已经有了通过 Koala 发布到他们的墙上的功能。 @oauth = Koala::Facebook::OAuth.new options[:fb_
我有一个 Ruby on Rails 应用程序,允许用户使用他们的 Facebook 帐户登录。我希望能够获得用户列表及其 Facebook 数据。我已经能够完成此操作,但是我必须为每个用户的姓名发送
也许这是个愚蠢的问题,但是如何从 Facebook 个人资料页面检索评论和他们的回复(最后 50 条)?例如:api.get_connections("depechemode","posts")(或
我使用 Koala在通过 API 调用与 Facebook 交互的应用程序中。我想记录 Koala 生成的原始 HTTP 请求以及 Facebook 在数据库中发回的响应。我如何获取这些字符串以便保存
我想在用户通过身份验证后拉入他们的新闻源。我正在使用 Koala gem,但如果我调用 get_connection('me', 'feed'),它只会返回我墙上的最后三个帖子。我想要显示在用户主页上
我正在尝试将一些代码从 Pandas 移植到 Koalas 以利用 Spark 的分布式处理。我正在获取一个数据框并将其分组到 A 和 B 上,然后应用一系列函数来填充新数据框的列。这是我在 Pand
尝试在 Databricks-Koalas 中复制 Pandas 功能在 Pandas 中: df = pd.DataFrame({'a': [450, 1, 26],
我不知道这是否是正确的部分,或者是否有一个部分,所以...抱歉! 无论如何,我是从 less 开始的,我正在看这个教程: "https://www.youtube.com/watch?v=pB7Ewx
我使用 Koala App 进行 Sass 编译。 我想为属性 CSS3 自动添加前缀 Screenshot my options SCSS: $radius: 14px; .test { b
我发现Koalas来自 Spark+AI 峰会,它将 pandas 引入 Spark。 据我所知,如果我需要将第三方函数映射到 Spark DataFrame,我必须在 Spark 集群的每个节点上安
我在 PySpark 中有一个 Koalas DataFrame。我想计算列标准差。我尝试过这样做: df2['x_std'] = df2[['x_1', 'x_2', 'x_3', 'x_4', '
我正在尝试使用以下代码使用 Koela 发布照片,但它没有标记用户 @graph.put_picture(pic_url,{:message => msg,:tags => [{:id => "xxx
我正在写一个简单的程序,自动创建一个 facebook邮政。据我了解,我需要有一个“用户访问 token ”才能做这个。我正在使用考拉(但其他人的理念相似库)。无论如何,我创建一个新的 OAuth 帐
我正在尝试使用经过身份验证的用户的 uid 返回好友列表。但是我只得到了部分返回值,部分 friend 被遗漏了: graph = Koala::Facebook::API.new(fb_token)
我提到我的 friend 使用 Koala,Ruby 和 Sinatra。我查看了文档,但一无所获。记住这一点,我不想给我的 friend 发信息,但我想和我一起提到他。我的代码: @graph =
我是一名优秀的程序员,十分优秀!