python - 根据三列的值有条件地交互式计算列-6ren

python - 根据三列的值有条件地交互式计算列

转载作者：太空宇宙更新时间：2023-11-03 17:03:35

26

4

我通过 Spyder IDE 运行 Windows 10、Python 2.7。

我有一只 Pandas DataFrame叫df :

df = pd.DataFrame({'fld1': ['x', 'x', 'x','y','y','y','z','z']
                , 'fld2': ['x', 'y', 'z','x','y','z','x','y']
                , 'relationship': [.25,.25,.50,.33,.33,.33,.5,.5]})

df
 Out[172]: 
  fld1 fld2  relationship
 0    x    x          0.25
 1    x    y          0.25
 2    x    z          0.50
 3    y    x          0.33
 4    y    y          0.33
 5    y    z          0.33
 6    z    x          0.50
 7    z    y          0.50

我想建立一个 function迭代 Dataframe 的行df在 df 中生成一个新列.

该函数的启动方式为:

第 1 步:获取 relationship列在哪里fld1 =x和fld2 =x然后

第 2 步:检查情况是否符合 fld1 =x具有更多唯一值 fld2 。

第 3 步:如果 fld2 有另一个唯一值与 fld1 相关=x (其中存在两个唯一值， x 和 y )，添加 relationship从步骤 1 到 relationship 的值fld1栏目=x以及 fld2 的下一个唯一值(在本例中 fld2 = y 是下一个唯一值)乘以关系的倒数(在本例中 fld1 = y 和 fld2 = x )

第 4 步:重复第 2 步，直到 fld2 的所有唯一值与 fld1 =x已经这样计算了

第 4 步:重复第 1 步获取下一个唯一值 fld1 。在这种情况下，它将是 fld1 =y

为了以另一种方式解释此函数逻辑，下面是如何在 excel 中完成此操作的示例:

        A       B         C             D
   1    fld1    fld2      relationship  Connection
   2    x        x         0.25         =C2+(C3*C5)+(C4*C8)
   3    x        y         0.25         =C3+(C4*C9)
   4    x        z         0.5          =C4+(C3*C7)
   5    y        x         0.33         =C5+(C7*C8)
   6    y        y         0.33         =C6+(C5*C3)+(C7*C9)
   7    y        z         0.33         =C7+(C5*C4)
   8    z        x         0.5          =C8+(C9*C5)
   9    z        y         0.5          =C9+(C8*C4)

该函数的输出应产生 Dataframe与 df2 相同如下:

df2 = pd.DataFrame({'fld1': ['x', 'x', 'x','y','y','y','z','z']
            , 'fld2': ['x', 'y', 'z','x','y','z','x','y']
            , 'relationship': [.25,.25,.50,.33,.33,.33,.5,.5]
            , 'connection':     [.5825,0.5,0.5825,0.495,0.5775,0.495,0.665,0.75]})

df2
Out[174]: 
    connection fld1 fld2  relationship
0      0.5825    x    x          0.25
1      0.5000    x    y          0.25
2      0.5825    x    z          0.50
3      0.4950    y    x          0.33
4      0.5775    y    y          0.33
5      0.4950    y    z          0.33
6      0.6650    z    x          0.50
7      0.7500    z    y          0.50

最佳答案

好吧，这是解决您问题的一种方法。我使用字典来保存每个组合的值。

xyzdict = {"xx":0.25,
          "xy":0.25,
          "xz":0.5,
          "yx":0.33,
          "yy":0.33,
          "yz":0.33,
          "zx":0.5,
          "zy":0.5}

然后，对于每个“连接”组合，第一个字母始终与 fld1 的第一个字母相同。第二个字母始终不是 fld1。因此，这是一种详尽的、可能不是 Pythonic 的方法来计算值并将组合的连接值存储在字典中以供以后使用。

cnxn = {}
xyz = ["x","y","z"]

for combo in xyzdict.keys():
    #print "the combo is %s" % (combo) #xyzdict[two] #actual value
    first_letter = combo[0]

    not_second = [combo[0],combo[1]]
    not_second_letter = list(set(xyz) - set(not_second))

    if len(not_second_letter) > 1:
        multi_cnxn = []
        for each_not_second_letter in not_second_letter:

            fwd = ''.join((first_letter,each_not_second_letter))
            rev = ''.join((each_not_second_letter,first_letter))
            cnxnval = xyzdict[fwd] * xyzdict[rev]

            multi_cnxn.append(cnxnval)

        rowvalue = xyzdict[combo] + sum(multi_cnxn)
        cnxn[combo] =rowvalue
    else:
        fwd = ''.join((first_letter,not_second_letter[0]))
        rev = ''.join((not_second_letter[0],first_letter))
        cnxnval = xyzdict[fwd] * xyzdict[rev]

        rowvalue = xyzdict[combo] + cnxnval
        cnxn[combo] = rowvalue

差不多就到了，定义一个函数check，它将提取您的fld1和fld2并返回cnxn<的计算值 上面。

def check(fld1,fld2,cnxn_sub):
    rowpair = ''.join((fld1,fld2))
    return cnxn_sub[rowpair]

最后，一只小 Pandas 申请把它们全部带回家。

df['connection'] = df.apply(lambda row: check(row['fld1'], row['fld2'],cnxn), axis=1)

这是我的结果，我们的“yz”连接有点关闭，不知道是你的还是我的......

fld1    fld2    relationship    connection
0   x   x   0.25    0.5825
1   x   y   0.25    0.5000
2   x   z   0.50    0.5825
3   y   x   0.33    0.4950
4   y   y   0.33    0.5775
5   y   z   0.33    0.4125
6   z   x   0.50    0.6650
7   z   y   0.50    0.7500

祝你好运!

关于python - 根据三列的值有条件地交互式计算列，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/34799167/

26

4

0

文章推荐： python - 总结从 'Col' 开始的每列的行值

文章推荐： ruby-on-rails - 字符串:用 * 号屏蔽最后 n 个字符

文章推荐： ruby-on-rails - 在 Ruby on Rails 中使用 like 查询进行搜索

文章推荐： Python 向 Xterm 发送命令

mysql随机更新两个日期之间的日期列(有条件)
如何在 2014-10-04 - 2014-10-30 仅工作日和 08.00 - 20.00 之间随机更新日期列？ 2014-10-04 - 2014-10-30 random working-da
将二维数组转换为一维数组(有条件)
我有一个二维 (3x7) 数组，我想转换为一维数组，以便我提供的行位于中心。行值可能沿途变化，但必须位于中心。 #define numRows 3 #define numCols 7 #define
Jpa OneToMany 有条件
我有2张 table : 第一个是“人”: person_id, 人名第二个是“PersonsGraphs”: person_id1, person_id2, 关系类型我正在寻找一种建立“家谱”的
java - @JsonIgnore 有条件
是否可以在序列化 JSON 响应的同时根据 If 条件排除某些元素？ if(a == 1) { //show element } else { //don't show element }
java - @JsonIgnore 有条件
是否可以在序列化 JSON 响应的同时根据 If 条件排除某些元素？ if(a == 1) { //show element } else { //don't show element }
javascript - jQuery 有条件
尝试使用 jQuery 编写一个条件，该条件基本上说明，如果 div.gathering 不包含 a.cat-link，则执行以下操作。我已经尝试过以下方法，但似乎不起作用。有人能解释一下吗？ if(
c - 在列表中插入节点的副本(有条件)
该练习要求插入值 x 的副本(这也是要在列表中搜索的值)，但前提是该位置是另一个值 n 的倍数。未指定副本应插入到 x 值之前还是之后。我的问题是并非在所有情况下都插入副本。我认为问题在于，当我插入
c - (有条件？)在函数中创建局部变量
我遇到了这个[问题]:How can I store values into a multi-parameter struct and pass typedef struct to a functio
java - 井字游戏(有条件)
出于某种原因，当我编写 getWinner() 时，它仅适用于 2 种情况(最后一行)。就对角线和列而言，我拥有其他一切，但第 2 行(嗯，三，但数组，所以 2)基本上只适用于 o。只有当 o 位于
MYSQL - 将一列复制到同一个表中的另一列 - 有条件
我有一个问题。我想将“guid”列中的值复制到“帖子内容” 所有行都在一个表“wp-posts”中 “postparent”列中的一行有一个值，而“ID”列中的另一项也有相同的值我必须做的事情是
MySQL - 合并两个表 - 有条件
我想将两个像这样的表合并到一个表中，并为重复的键行添加合并表中最旧的 DateAdded 值。 (Key1,Key2) 是主键。 +-----------+-----------+------+---
mysql - 选择具有最大值的唯一行(有条件)
通过下面的表格和数据，我试图获得最高的 effective_from每个唯一 brand 小于当前时间戳的值/model组合 - 实际上是每件商品的当前价格。 CREATE TABLE things
mysql - 如何删除未知号码的最后一条记录(有条件)？
您能告诉我如何删除未知号码的最后一条记录(有条件)吗？例如，在这种情况下我想删除id为6到10的记录。注意:该表和记录不是恒定的。 +----+-----+---------+ | id | ur
php - 添加时间到mysql时间戳列，有条件
这个问题不太可能对任何 future 的访客有帮助；它只与一个较小的地理区域、一个特定的时间点或一个非常狭窄的情况相关，通常不适用于全世界的互联网受众。如需帮助使此问题更广泛适用，visit the
mysql - 多次计算带有外键的子表，有条件
我有两个表，标签 -> id,name,description,user,status 标签_连接。 -> id, Label_id, 类别所以有多个类别，假设 1 => 新的，2 => 旧的。
java - 将每个单词的第一个字母移动到末尾并添加一个字符，有条件
好的，我会长话短说。这是我的代码 String s = edittextkata.getText().toString(); String[] vowels = {"a","
Linux 查找和替换(有条件)
我有一个非常具体的要求，我发现很难做到，我需要查找并替换文件中的某些行，但问题是文本不同，唯一的好处是它们都有一个 .[扩展名] 例如: 30/07/2012 14:46 17
MongoDB updateMany 有条件
我有一个大型数据库，其中存在各种不一致之处。我想澄清的项目之一是根据人口更改国家/地区状态。数据样本是: { "_id" : "D", "name" : "Deutschland", "pop" :
arrays - 将范围(有条件)中的唯一值组合到另一个范围中
我需要将范围(有条件)中的唯一值组合到同一行的另一个范围中。其实我前两天发过类似的问题Link所提供的答案在我提出上述问题时有效。但后来，我遇到了一个新问题，我宁愿问一个新的问题，让它更清楚: (
VBA - 将字符串中的字符拆分、复制和粘贴到另一个单元格(有条件)
我刚开始使用 VBA，并且正在努力处理需要清理的工作表。我有一列包含混合邮政编码和城市名称的字符串。我想从 A 列中提取邮政编码并放在 B 列中，并在 C 列中提取带有下划线的城市名称。我的(示例

首页

博学

6Ren·AI

商城

python - 根据三列的值有条件地交互式计算列