python - 如何迭代数据框-6ren

python - 如何迭代数据框

转载作者：行者123 更新时间：2023-12-01 07:27:47

26

4

我有一个用户、书籍和评分的数据集，我想找到对特定书籍评分较高的用户，并且对于这些用户，我想找到他们也喜欢的其他书籍。

我的数据如下:

df.sample(5)

    User-ID     ISBN    Book-Rating
49064   102967  0449244741  8
60600   251150  0452264464  9
376698  52853   0373710720  7
454056  224764  0590416413  7
54148   25409   0312421273  9

到目前为止我所做的:

df_p = df.pivot_table(index='ISBN', columns='User-ID', values='Book-Rating').fillna(0)
lotr = df_p.ix['0345339703'] # Lord of the Rings Part 1
like_lotr = lotr[lotr > 7].to_frame()
users = like_lotr['User-ID']

最后一行失败

KeyError: 'User-ID'

我想获取LOTR > 7的用户，以便这些用户进一步从矩阵中找到他们也喜欢的电影。

如果有帮助，我们将不胜感激。谢谢。

最佳答案

在您的 like_lotr 数据框中，'User-ID' 是索引的名称，您无法像普通列一样选择它。这就是为什么 users = like_lotr['User-ID'] 行引发 KeyError 的原因。它不是一个专栏。

此外，不推荐使用 ix ，最好在您的情况下使用 loc 。并且不要加引号:它必须是一个整数，因为 'User-ID' 最初是一列整数(至少来自您的示例)。

尝试这样:

df_p = df.pivot_table(index='ISBN', columns='User-ID', values='Book-Rating').fillna(0)
lotr = df_p.loc[452264464] # used another number from your sample dataframe to test this code.
like_lotr = lotr[lotr > 7].to_frame()
users = like_lotr.index.tolist()

user 现在是一个包含您想要的 ID 的列表。

使用上面的小样本和我用来测试的数字，用户是[251150]。

<小时/>

另一种解决方案是使用reset_index。最后两行应该如下所示:

like_lotr = lotr[lotr > 7].to_frame().reset_index()
users = like_lotr['User-ID']

reset_index 将索引放回列中。

关于python - 如何迭代数据框，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57363295/

26

4

0

文章推荐： python - 正确使用生成器输入

文章推荐： Java 循环和随机数

文章推荐： python - pyspark 'DataFrame' 对象没有属性 '_get_object_id'

文章推荐： java - 如何在 Java 中通过引用传递可变参数

C++ bool 代数
我已经将一些变量声明为 bool 值，我希望 C++ 在我进行一些 bool 加法时知道该做什么，但它并没有按照我希望的方式发生。我如何让它工作。 #include using namespace s
mysql - 在SQL中模拟环(代数)
我正在创建小型配置文件查看器，我想在 SQL 中模拟环。怎么运行的？对于简单:我的 table 上有 5 个用户。当我从中间获得一个到我的实验(如用户编号 2、3、4)时，下一个和上一个用户是 CUR
filesystems - 什么是 inode 代数？
我计划使用低级 API 实现 FUSE 文件系统，目前正在尝试了解 fuse_entry_param结构体。不知道是什么unsigned long fuse_entry_param::generat
javascript - boolean 代数 - 如何化简
从事 JS 工作，刚刚开始学习 boolean 代数。想知道是否有办法简化这个表达式: (!variableOne || !variableTwo) 我记得听说过两个“not”意味着你可以改变符号，但
haskell - 授予可遍历的 F 代数，是否可能对应用代数进行变形？
我有这个 F-代数 (introduced in a previous question)，我想在它上面施放一个有效的代数。通过绝望的试验，我设法组合了一个有效的 monadic catamorphi
boolean-logic - bool 代数 - 证明德摩根定律
我在 Google 上到处寻找德摩根定律的 bool 代数(不是集合论)证明，但找不到。 Stack Overflow 也缺少 DeMorgan 定律问题。作为我的 CIS 251 类(class)
boolean-logic - bool 代数 : Prove that
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。想改善这个问题吗？更新问题，使其成为 on-topic对于堆栈溢出。 7年前关闭。 Improve thi
javascript - bool 代数 - 使用 AND/OR 导出条件表达式是棘手的部分
正在解决这个问题。验证闰年的基本规则如下: - 大多数能被4整除的年份都是闰年。 - 异常(exception):世纪年不是闰年，除非它们可以被 400 整除。这就是答案: if(y%4==0 &
algorithm - 如何用多个变量简化 Big O 代数
假设算法的最坏情况运行时间可以描述为: T(n) = O(n) + O(r^2) + O(n-r) n 是输入大小，r 是根据算法创建分区的索引。这个等式可以进一步简化吗？如果变量都是 n 那么它将
javascript - JavaScript 中的 bool 代数
有没有办法在 JS 中使用 bool 代数？例如，我想遍历一个包含 true 和 false 的数组，并将其简化为只有 true 或 false。用 bool 代数来做这件事似乎是一种优雅的方式.
python - Pandas 中的 DataFrame 代数
假设我有两个数据框 df1 df2 我可以加入 df1_keys 和 df2_keys。我想做的事: (A-B) (A-B) U (B-A) A=df1 和 B=df2。根据我在 document
c - bool 代数 NOT 和 DWORD - 建议修复
这个问题已经有答案了: How can I remove a flag in C? (3 个回答) How to set, clear, and toggle a single bit? (27 个回
hadoop - 实现自定义 Apache pig 代数 UDF
大家我实现了自定义聚合 pig UDF。UDF 实现了 Algebraic 接口(interface)，并且有 3 个类 - Initial、Intermed 和 Final 在不同阶段进行工作。它
python - Pandas bool 代数 : True if True in both columns
我想制作一个 bool 向量，它是通过比较两个输入 bool 向量创建的。我可以使用 for 循环，但有更好的方法吗？我理想的解决方案是这样的: df['A'] = [True, False, Fa
java - 如何为 group by 编写 pig 代数 udf
我想编写一个 pig 代码来执行分组并生成 31 个字段的总和，但在此之前我需要做一些自定义处理，为此我编写了一个 eval 函数。我想如果我可以将 GROUP 和 SUM 操作包含到 UDF 中，我
boolean - 将 4 个与非门简化为 1 个异或门 boolean 代数？
我试图通过 boolean 代数来理解使用 4 个与非门如何等同于 1 个异或门。如果我们从维基百科看这张图片 http://en.wikipedia.org/wiki/XOR_gate#Alter

首页

博学

6Ren·AI

商城

python - 如何迭代数据框