python - 如何在没有单独表(pandas 或 SQL)的情况下获取 Employee --> Manager？-6ren

python - 如何在没有单独表(pandas 或 SQL)的情况下获取 Employee --> Manager？

转载作者：搜寻专家更新时间：2023-10-30 20:17:33

24

4

在 pandas 中是否有简单的代码可以做到这一点？或者我应该试试 SQL(我对 SQL 不是很熟悉)。这是我目前所拥有的(假的例子，真实的大约有 20,000 个人)

员工_df =

    EmpID   Name    Title   ManagerID
    abc123   John   Head    pqr456
    pqr456   Jake   VP      bs92999
    zyx987   Jill   Lead    abc123
    bs92999  Bob    SVP     NaN

复制数据框:manager_df = employee_df

roster = pd.merge(manager_df, employee_df, how='outer', left_on ='ManagerID', right_on = 'EmpID')

我的输出很乱，虽然看起来是正确的(它告诉我谁是经理，但没有通过引用自身的单独表格)。

    EmpID_x Name_x  Title_x ManagerID_x  EmpID_y Name_y Title_y ManagerID_y
    abc123  John    Head      pqr456    pqr456   Jake       VP          bs92999
    pqr456  Jake    VP        bs92999   bs92999  Bob        SVP         NaN
    zyx987  Jill    Lead      abc123    abc123   John       Head        pqr456
    bs92999 Bob     SVP       NaN       NaN      NaN        NaN        NaN
    NaN     NaN     NaN       NaN       zyx987   Jill       Lead        abc123

最常见的期望输出是:

EmpID | Name | Title | Manager_Name

但有时我也需要另一个级别(老板的老板)，最大潜力大约 5 层，这看起来很疯狂，但有很多层次 - 这么高的层次并不是一直都需要，但我如果需要，希望能够将此数据滚动到更高级别:

EmpID | Name | Title | Manager_Name_1 | Manager_Name_2

第三个数据框是reporting_df:

EmpID | ManagerID | StartDate | EndDate

有时甚至在月中也会发生管理层变动，结果应反射(reflect)在该日期“拥有”该员工的经理。

file = 任何具有 EmpID 的文件或报告，我可能想在其中找出经理(或他们的经理)在该日期的身份，该日期也包含在文件中。这是解决这个问题的正确方法吗？

for i in range(len(file)):  
        file.ix[i,'Manager'] = reporting_df[(reporting_df.StartDate.shift(-1) > file.StartDate[i]) &(reporting_df.StartDate <= file.Date[i])]

最佳答案

这在某些方面可能有点棘手，所以让我们逐步构建它。首先，让我们稍微重命名这些列，以便稍后进行操作(只需将“_0”添加到其中的三个列):

     EmpID Name_0 Title_0 ManagerID_0
0   abc123   John    Head      pqr456
1   pqr456   Jake      VP     bs92999
2   zyx987   Jill    Lead      abc123
3  bs92999    Bob     SVP         NaN

这里的主要技巧是我们需要一个映射，这可以用一个系列来完成:

df.set_index('EmpID')['Name_0']

这里的关键是我们将 'EmpID' 设置为索引，然后它会为我们提供从 'EmpID' 到 'Name_0' 的映射，我们可以对 'Title_0' 和 'ManagerID_0' 做同样的事情。

对一列进行尝试:

df['ManagerID_0'].map( df.set_index('EmpID')['Name_0'] )

0    Jake
1     Bob
2    John
3     NaN

现在只需用 'for' 包裹起来即可获得完整版本:

for i in range(3):
    for col in ['Name_','Title_','ManagerID_']:
        df[col+str(i+1)] = df['ManagerID_'+str(i)].map( 
                                            df.set_index('EmpID')[col+'0'] )

     EmpID Name_0 Title_0 ManagerID_0 Name_1 Title_1 ManagerID_1 Name_2    
0   abc123   John    Head      pqr456   Jake      VP     bs92999    Bob   
1   pqr456   Jake      VP     bs92999    Bob     SVP         NaN    NaN   
2   zyx987   Jill    Lead      abc123   John    Head      pqr456   Jake   
3  bs92999    Bob     SVP         NaN    NaN     NaN         NaN    NaN   

  Title_2 ManagerID_2 Name_3 Title_3 ManagerID_3  
0     SVP         NaN    NaN     NaN         NaN  
1     NaN         NaN    NaN     NaN         NaN  
2      VP     bs92999    Bob     SVP         NaN  
3     NaN         NaN    NaN     NaN         NaN

我将范围设置为 3，因为每个人的“ManagerID_3”都为 NaN，但如果您有更多级别，当然可以将其设置得更高。

关于python - 如何在没有单独表(pandas 或 SQL)的情况下获取 Employee --> Manager？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/30386735/

24

4

0

文章推荐： c++ - 如何避免在程序启动时重新加载大数据

文章推荐： sql - 如何删除具有多个值的行并仅选择 1 行

文章推荐： ios - setTorchModeOnWithLevel 不工作

文章推荐： database - Heroku:删除附加组件后我可以恢复数据库吗？

mysql - 同步/流式传输 MySQL 表/表(连接表)与 PostgreSQL 表/表
我有一台 MySQL 服务器和一台 PostgreSQL 服务器。需要从多个表中复制或重新插入一组数据 MySQL 流式传输/同步到 PostgreSQL 表。这种复制可以基于时间(Sync)或事
php - 从用户(表)获取数据其中用户(表)的id等于 friend (表)的id
如果两个表的 id 彼此相等，我尝试从一个表中获取数据。这是我使用的代码: SELECT id_to , email_to , name_to , status_to
sql - Excel 表 SQL 表
我有一个 Excel 工作表。顶行对应于列名称，而连续的行每行代表一个条目。如何将此 Excel 工作表转换为 SQL 表？我使用的是 SQL Server 2005。最佳答案这取决于您使用哪
mysql - 如何将两个django模型(表)合并为一个模型(表)
我想合并两个 Django 模型并创建一个模型。让我们假设我有第一个表表 A，其中包含一些列和数据。 Table A -------------- col1 col2 col3 col
mysql - 表 1、表 2 的多列左连接
我有两个表:table1，table2，如下所示 table1: id name 1 tamil 2 english 3 maths 4 science table2: p
sql - 大传感器数据最佳选择。表 SQL 与 Azure 表
关闭。此题需要details or clarity 。目前不接受答案。想要改进这个问题吗？通过 editing this post 添加详细信息并澄清问题. 已关闭 1 年前。 Improve th
dynamics-ax-2009 - 表=表与表.数据(表)
下面两个语句有什么区别？ newTable = orginalTable 或 newTable.data(originalTable) 我怀疑 .data() 方法具有性能优势，因为它在标准 AX 中
SQL Server 表 -(或可能是任何 SQL 表)没有主键会影响性能吗？
我有一个表，我没有在其中显式定义主键，它并不是真正需要的功能......但是一位同事建议我添加一个列作为唯一主键以随着数据库的增长提高性能...... 谁能解释一下这是如何提高性能的？没有使用索引(
php - 将产品详细信息插入 'product' 表，并将产品图像插入 'image' 表
如何将表“产品”中的产品记录与其不同表“图像”中的图像相关联？我正在对产品 ID 使用自动增量。我觉得不可能进行关联，因为产品 ID 是自动递增的，因此在插入期间不可用! 如何插入新产品，获取产品
python - 创建一个新的 sql 表，其中的列源自另一个 sql 表
我有一个 sql 表，其中包含关键字和出现次数，如下所示(尽管出现次数并不重要): ____________ dog | 3 | ____________ rat | 7 | ____
MySQL LAST_INSERT_ID() 与 INSERT INTO 表 SELECT FROM 表
是否可以使用目标表中的LAST_INSERT_ID更新源表？ INSERT INTO `target` SELECT `a`, `b` FROM `source` 目标表有一个自动增量键id，我想将其
mysql - 查询 - 在简单的 mysql 内连接中定义(表，表)
我正在重建一个搜索查询，因为它在“我看到的”中变得多余，我想知道什么 (albums_artists, artists) ( ) does in join? is it for boosting pe
innodb - mysqldump 备份缺少所有 innodb 表，但没有 MyISAM 表
以下是我使用 mysqldump 备份数据库的开关: /usr/bin/mysqldump -u **** --password=**** --single-transaction --databas
html - 为什么 MySQL 表中的所有行都是相同的？ (MySQL 表 > HTML 表)
我试图获取 MySQL 表中的所有行并将它们放入 HTML 表中: Exam ID Status Assigned Examiner
mysql - 查询 'photos' 表，同时查询 'bookmarks' 表，以便知道添加书签的照片
如何查询名为 photos 的表中的所有记录，并知道当前用户使用单个查询将哪些结果照片添加为书签？这是我的表格: -- -- Table structure for table `photos` -
Mysql MEMORY 表 vs InnoDB 表(很多插入，很少读取)
我的网站都在 InnoDB 表上运行，目前为止运行良好。现在我想知道在我的网站上实时发生了什么，所以我将每个页面浏览量(页面、引荐来源网址、IP、主机名等)存储在 InnoDB 表中。每秒大约有 10
mysql - 如何在 mysql 中存储客户数据(2 表 vs 1 表)
我在想我会为 mysql 准备两个表。一个用于存储登录信息，另一个用于存储送货地址。这是传统方式还是所有内容都存储在一张表中？对于两个表...有没有办法自动将表 A 的列复制到表 B，以便我可以引用
mysql - 表 1 包含名字和姓氏，表 2 包含两列引用表 1 上的名称
我不是程序员，我从这个表格中阅读了很多关于如何解决我的问题的内容，但我的搜索效果不好我有两张 table 表 1:成员 id*| name | surname -------------------
c# - 如何在 ASP.NET 中显示 "View"表(SQL 表)？
我知道如何在 ASP.NET 中显示真实表，例如 public ActionResult Index() { var s = db.StaffInfoDBSet.ToList(); r
php - INSERT INTO 表 VALUES.. 与 INSERT INTO 表 SET 错误
我正在尝试运行以下查询: "insert into visits set source = 'http://google.com' and country = 'en' and ref = '1234

首页

博学

6Ren·AI

商城

python - 如何在没有单独表(pandas 或 SQL)的情况下获取 Employee --> Manager？