- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我通过 Spyder IDE 运行 Windows 10、Python 2.7。
我有一只 Pandas DataFrame
叫df
:
df = pd.DataFrame({'fld1': ['x', 'x', 'x','y','y','y','z','z']
, 'fld2': ['x', 'y', 'z','x','y','z','x','y']
, 'relationship': [.25,.25,.50,.33,.33,.33,.5,.5]})
df
Out[172]:
fld1 fld2 relationship
0 x x 0.25
1 x y 0.25
2 x z 0.50
3 y x 0.33
4 y y 0.33
5 y z 0.33
6 z x 0.50
7 z y 0.50
我想建立一个 function
迭代 Dataframe
的行df
在 df
中生成一个新列.
该函数的启动方式为:
第 1 步:获取 relationship
列在哪里fld1
=x
和fld2
=x
然后
第 2 步:检查情况是否符合 fld1
=x
具有更多唯一值 fld2
。
第 3 步:如果 fld2
有另一个唯一值与 fld1
相关=x
(其中存在两个唯一值, x
和 y
),添加 relationship
从步骤 1 到 relationship
的值fld1
栏目=x
以及 fld2
的下一个唯一值(在本例中 fld2
= y
是下一个唯一值)乘以关系的倒数(在本例中 fld1
= y
和 fld2
= x
)
第 4 步:重复第 2 步,直到 fld2
的所有唯一值与 fld1
=x
已经这样计算了
第 4 步:重复第 1 步获取下一个唯一值 fld1
。在这种情况下,它将是 fld1
=y
为了以另一种方式解释此函数逻辑,下面是如何在 excel
中完成此操作的示例:
A B C D
1 fld1 fld2 relationship Connection
2 x x 0.25 =C2+(C3*C5)+(C4*C8)
3 x y 0.25 =C3+(C4*C9)
4 x z 0.5 =C4+(C3*C7)
5 y x 0.33 =C5+(C7*C8)
6 y y 0.33 =C6+(C5*C3)+(C7*C9)
7 y z 0.33 =C7+(C5*C4)
8 z x 0.5 =C8+(C9*C5)
9 z y 0.5 =C9+(C8*C4)
该函数的输出应产生 Dataframe
与 df2
相同如下:
df2 = pd.DataFrame({'fld1': ['x', 'x', 'x','y','y','y','z','z']
, 'fld2': ['x', 'y', 'z','x','y','z','x','y']
, 'relationship': [.25,.25,.50,.33,.33,.33,.5,.5]
, 'connection': [.5825,0.5,0.5825,0.495,0.5775,0.495,0.665,0.75]})
df2
Out[174]:
connection fld1 fld2 relationship
0 0.5825 x x 0.25
1 0.5000 x y 0.25
2 0.5825 x z 0.50
3 0.4950 y x 0.33
4 0.5775 y y 0.33
5 0.4950 y z 0.33
6 0.6650 z x 0.50
7 0.7500 z y 0.50
最佳答案
好吧,这是解决您问题的一种方法。我使用字典来保存每个组合的值。
xyzdict = {"xx":0.25,
"xy":0.25,
"xz":0.5,
"yx":0.33,
"yy":0.33,
"yz":0.33,
"zx":0.5,
"zy":0.5}
然后,对于每个“连接”组合,第一个字母始终与 fld1
的第一个字母相同。第二个字母始终不是
fld1
。因此,这是一种详尽的、可能不是 Pythonic 的方法来计算值并将组合的连接值存储在字典中以供以后使用。
cnxn = {}
xyz = ["x","y","z"]
for combo in xyzdict.keys():
#print "the combo is %s" % (combo) #xyzdict[two] #actual value
first_letter = combo[0]
not_second = [combo[0],combo[1]]
not_second_letter = list(set(xyz) - set(not_second))
if len(not_second_letter) > 1:
multi_cnxn = []
for each_not_second_letter in not_second_letter:
fwd = ''.join((first_letter,each_not_second_letter))
rev = ''.join((each_not_second_letter,first_letter))
cnxnval = xyzdict[fwd] * xyzdict[rev]
multi_cnxn.append(cnxnval)
rowvalue = xyzdict[combo] + sum(multi_cnxn)
cnxn[combo] =rowvalue
else:
fwd = ''.join((first_letter,not_second_letter[0]))
rev = ''.join((not_second_letter[0],first_letter))
cnxnval = xyzdict[fwd] * xyzdict[rev]
rowvalue = xyzdict[combo] + cnxnval
cnxn[combo] = rowvalue
差不多就到了,定义一个函数check
,它将提取您的fld1
和fld2
并返回cnxn<的计算值
上面。
def check(fld1,fld2,cnxn_sub):
rowpair = ''.join((fld1,fld2))
return cnxn_sub[rowpair]
最后,一只小 Pandas 申请
把它们全部带回家。
df['connection'] = df.apply(lambda row: check(row['fld1'], row['fld2'],cnxn), axis=1)
这是我的结果,我们的“yz”连接有点关闭,不知道是你的还是我的......
fld1 fld2 relationship connection
0 x x 0.25 0.5825
1 x y 0.25 0.5000
2 x z 0.50 0.5825
3 y x 0.33 0.4950
4 y y 0.33 0.5775
5 y z 0.33 0.4125
6 z x 0.50 0.6650
7 z y 0.50 0.7500
祝你好运!
关于python - 根据三列的值有条件地交互式计算列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34799167/
如何在 2014-10-04 - 2014-10-30 仅工作日和 08.00 - 20.00 之间随机更新日期列? 2014-10-04 - 2014-10-30 random working-da
我有一个二维 (3x7) 数组,我想转换为一维数组,以便我提供的行位于中心。行值可能沿途变化,但必须位于中心。 #define numRows 3 #define numCols 7 #define
我有2张 table : 第一个是“人”: person_id, 人名 第二个是“PersonsGraphs”: person_id1, person_id2, 关系类型 我正在寻找一种建立“家谱”的
是否可以在序列化 JSON 响应的同时根据 If 条件排除某些元素? if(a == 1) { //show element } else { //don't show element }
是否可以在序列化 JSON 响应的同时根据 If 条件排除某些元素? if(a == 1) { //show element } else { //don't show element }
尝试使用 jQuery 编写一个条件,该条件基本上说明,如果 div.gathering 不包含 a.cat-link,则执行以下操作。我已经尝试过以下方法,但似乎不起作用。有人能解释一下吗? if(
该练习要求插入值 x 的副本(这也是要在列表中搜索的值),但前提是该位置是另一个值 n 的倍数。未指定副本应插入到 x 值之前还是之后。 我的问题是并非在所有情况下都插入副本。我认为问题在于,当我插入
我遇到了这个[问题]:How can I store values into a multi-parameter struct and pass typedef struct to a functio
出于某种原因,当我编写 getWinner() 时,它仅适用于 2 种情况(最后一行)。就对角线和列而言,我拥有其他一切,但第 2 行(嗯,三,但数组,所以 2)基本上只适用于 o。只有当 o 位于
我有一个问题。 我想将“guid”列中的值复制到“帖子内容” 所有行都在一个表“wp-posts”中 “postparent”列中的一行有一个值,而“ID”列中的另一项也有相同的值 我必须做的事情是
我想将两个像这样的表合并到一个表中,并为重复的键行添加合并表中最旧的 DateAdded 值。 (Key1,Key2) 是主键。 +-----------+-----------+------+---
通过下面的表格和数据,我试图获得最高的 effective_from每个唯一 brand 小于当前时间戳的值/model组合 - 实际上是每件商品的当前价格。 CREATE TABLE things
您能告诉我如何删除未知号码的最后一条记录(有条件)吗? 例如,在这种情况下我想删除id为6到10的记录。 注意:该表和记录不是恒定的。 +----+-----+---------+ | id | ur
这个问题不太可能对任何 future 的访客有帮助;它只与一个较小的地理区域、一个特定的时间点或一个非常狭窄的情况相关,通常不适用于全世界的互联网受众。如需帮助使此问题更广泛适用,visit the
我有两个表, 标签 -> id,name,description,user,status 标签_连接。 -> id, Label_id, 类别 所以有多个类别,假设 1 => 新的,2 => 旧的。
好的,我会长话短说。 这是我的代码 String s = edittextkata.getText().toString(); String[] vowels = {"a","
我有一个非常具体的要求,我发现很难做到,我需要查找并替换文件中的某些行,但问题是文本不同,唯一的好处是它们都有一个 .[扩展名] 例如: 30/07/2012 14:46 17
我有一个大型数据库,其中存在各种不一致之处。我想澄清的项目之一是根据人口更改国家/地区状态。 数据样本是: { "_id" : "D", "name" : "Deutschland", "pop" :
我需要将范围(有条件)中的唯一值组合到同一行的另一个范围中。 其实我前两天发过类似的问题Link所提供的答案在我提出上述问题时有效。 但后来,我遇到了一个新问题,我宁愿问一个新的问题,让它更清楚: (
我刚开始使用 VBA,并且正在努力处理需要清理的工作表。 我有一列包含混合邮政编码和城市名称的字符串。我想从 A 列中提取邮政编码并放在 B 列中,并在 C 列中提取带有下划线的城市名称。 我的(示例
我是一名优秀的程序员,十分优秀!