- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
所以我有一个非常愚蠢的问题,我已经绊倒了几个小时了。我正在使用 graphlab create 练习 kaggle 的 Titanic ML 练习。
现在我想替换表中的一些值。例如,我想将年龄设置(作为测试)Pclass==1 的年龄为 38,Pclass==2 的年龄设置为 30,Pclass==3 的年龄设置为 26
我尝试了很多方法来做到这一点,但我迷失了。
我现在所拥有的是:
df = gl.SFrame(data)
df[(df["Pclass"]==1)] #will print the rows of the table where Pclass=1
df["Age"][df["Pclass"]==1] #will display an array containg only the column "Age" for Pclass=1
现在我正在尝试正确使用 SFrame.apply,但我很困惑。
我已经尝试过
df["Age"][df["Pclass"]==1].apply(lambda x: 38)
这会返回一个具有正确值的数组,但我无法将其应用于 SFrame。例如,我尝试过:
df = df["Age"][df["Pclass"]==1].apply(lambda x: 38)
但是现在我的 DataFrame 变成了一个列表......(显然)
我也尝试过:
df["Age"] = df["Age"][df["Pclass"]==1].apply(lambda x: 38)
但我收到以下错误:“RuntimeError:运行时异常。列“__PassengerId-Survived-Pclass-Sex-Age-Fare”的大小与当前列的大小不同!”
我确信解决方案非常简单,但我太困惑了,无法自己找到它。
最终我想要类似的东西df["Age"] = Something.apply(lambda x: 38 if Pclass==1 else 30 if Pclass==2 else 26 if Pclass==3)
谢谢。
最佳答案
您可以使用如下替代代码:
只需在原始Sframe中创建一个新列'Pclass_',即可:
df['Pclass_'] = [1 if item == 38 else 2 if item == 30 else 3 if item == 26 else 4 for item in df['Age']]
您可以在列表中使用任何类型的 (if-else-if) 条件。
关于python - 图实验室 : replacing values in Sframe and filtering,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42704263/
我正在使用 graphlab 库中的 sframes。我需要按行进行一些计算。此外,如果我能够转置 sframe,则 sframe 结构在我的情况下会更有意义。 有什么办法可以做到吗?还是可以在我可以
我有一个大约 20GB 的庞大数据集。我已经使用 graphlab.SFrame.read_csv() 读取了数据。我有一个日期列,它被读取为格式为 yyyy-dd-mm 的字符串。但我希望将该列作为
拜托,谁能告诉我,我如何从 SFrame 中的每个值中取对数,graphlab(或 DataFrame,pandas)列,而不遍历 SFrame 列的整个长度? 我对类似的功能特别感兴趣,比如 Gro
我对如何选择 SFrame 数组中的特定行感到困惑。我可以在此处选择第一行: sf +-------------------------------+ | X1
我已加入 coursera 上的机器学习类(class)。我在执行以下命令时遇到问题: sales = graphlab.SFrame('home_data.gl/') 错误如下: IOErr
我正在使用 graphlab 和 sframes 在 ipython 笔记本中构建重复订单报告。我有一个 csv 文件,其中包含大约 10 万行数据,其中包含 user_id、user_email、u
我需要将 SFrame 列转换为列表。 输入: `+---------+ | word | +---------+ | love | | loves | |
在 graphlab 中,我有以下 SFrame 调用 train: import graphlab train = graphlab.read_csv('clean_train.csv') trai
我正在浏览 Graphlab 文档,我正在尝试弄清楚如何复制 pandas 功能,如果 na 值被中值、均值或模式等替换...在 Pandas 中,您只需通过以下方式执行此操作:df.dropna()
我有一个制表符分隔的文件: $ echo -e 'abc\txyz\t0.9\nefg\txyz\t0.3\nlmn\topq\t0.23\nabc\tjkl\t0.5\n' > test.txt $
我有这样一个 sframe: +---------+------+-------------------------------+-----------+------------------+ | t
任何人都可以,请告诉我,我如何绘制 SFrame (甚至更好 SArray )或将此类型转换为 python 中的某些常见类型。例如,当我尝试将 SArray 转换为 Pandas 对象时: pand
如何对 SFrame graphlab 的一列中的所有值求和。我试着查看官方文档,它只针对 SaArray( doc )没有任何例子。 最佳答案 >>> import graphlab as gl >
给定一个 Graphlab SFrame: +-------+------------+---------+-----------+ | Store | Date | Sales |
有一个 SFrame,其中的列具有 dict 元素。 import graphlab import numpy as np a = graphlab.SFrame({'col1':[{'oshan':
我有以下代码,其中使用循环提取一些信息并使用这些信息创建一个新矩阵。但是,由于我使用的是循环,因此该代码需要很长时间才能完成。 我想知道是否有更好的方法通过使用 GraphLab 的 SFrame 或
我正在尝试对充满数据的 s 帧使用简单的应用。这是针对其中一列的简单数据转换,应用一个接受文本输入并将其拆分为列表的函数。这是函数及其调用/输出: In [1]: def count_word
我有两列字符串。让我们说 col1 和 col2现在我们如何使用 graphlab SFrame 将 col1 和 col2 的内容合并到 col3 中? col1 col2 23 33 42
我有一个 SFrame,其外观与 sf.print_rows(10) 类似: +--------------+---------------+-------+---------------------
我想创建一个SFrame来自 NumPy 数组。 我具体想要的是: np.arange(16).reshape(4, 4) => +----+----+----+----+ | 0 | 1 | 2
我是一名优秀的程序员,十分优秀!