- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
示例数据说明:
import pandas as pd
animals = pd.DataFrame({'name': ['ostrich', 'parrot', 'platypus'],
'legs': [2, 2, 4],
'flight': [False, True, False],
'beak': [True, True, True],
'feathers': [True, True, False]})
bipeds = (animals.legs == 2)
print(animals[bipeds])
name legs flight beak feathers
0 ostrich 2 False True True
1 parrot 2 True True True
在我的用例中,每个这样的条件都是从文本搜索字符串中的一个术语中解析出来的,所以我需要以编程方式构造它们。 (我知道 Pandas 的
query ,但我需要不同的功能。)为此编写一个函数非常简单:
def comp_search(df, column_name, comp, value):
return getattr(df[column_name], f'__{comp}__')(value)
bipeds = comp_search(animals, 'legs', 'eq', 2)
检查任何给定的 boolean 列就像
animals[animals.feathers]
一样简单。 .
set(df[features]) <= set(values)
假设这样的条件可以这样构建:
def set_comp_search(df, column_names, comp, values):
return getattr(set(df[column_names]), f'__{comp}__')(set(values))
当然,这些都不起作用,如
set()
的数据框创建一组普通的列名。
apply
来实现将每行 boolean 值转换为一个集合,然后与生成的一系列集合进行比较:
def row_to_set(row):
return set(label for label, value
in zip(row.index, row)
if value)
def set_comp_search(df, column_names, comp, values):
series_of_sets = df[column_names].apply(row_to_set, axis=1)
return getattr(series_of_sets, f'__{comp}__')(set(values))
简洁明了!不幸的是,使用
apply
进行迭代当源数据帧长到数千行时,速度会变得非常慢。
def set_comp_search(df, column_names, comp, values):
other_column_names = set(column_names) - set(values)
value_columns = df[values]
other_columns = df[other_column_names]
if comp == 'gt':
# All the searched features, and at least one other
return value_columns.all(axis=1) & other_columns.any(axis=1)
if comp == 'ge':
# All the searched features
return value_columns.all(axis=1)
if comp == 'eq':
# All the searched features, and none other
return value_columns.all(axis=1) & ~other_columns.any(axis=1)
if comp == 'le':
# No other features
return ~other_columns.any(axis=1)
if comp == 'lt':
# Not all of the searched features, and none other
return ~value_columns.all(axis=1) & ~other_columns.any(axis=1)
所以如果我想要一个条件来表示
set(animals[features]) > {'beak'}
:
more_than_beak = set_comp_search(animals, {'flight', 'beak', 'feathers'},
'gt', {'beak'})
# Converts to: (animals.beak) & (animals.flight | animals.feathers)
print(animals[more_than_beak])
name legs flight beak feathers
0 ostrich 2 False True True
1 parrot 2 True True True
# Correctly omits the platypus
除了笨拙之外,这运行得足够快。但我觉得我必须重新发明一个轮子。这似乎与
Series.str
的用例大致相似。方法可以,尽管它需要使用数据帧、系列序列或 numpy 数组而不是单个系列进行操作。 (遗憾的是没有
DataFrame.set
模块。)
最佳答案
在我看来,您可能会从使用 numpy 向量化的函数中受益。以下是此类函数的示例,即矢量化及其应用:
def analyze_birds (name: str, legs: int, feathers: bool):
if feathers and legs == 2 :
return name + "-Feathered Biped"
if legs > 2 :
return name + "-Quadruped"
vector_analyze_birds = np.vectorize(analyze_birds)
animals['Analysis'] = vector_analyze_birds(animals['name'], animals['legs'], animals['feathers'])
Output
关于python - 用于与多个 boolean 列/系列进行类似集合比较的矢量化 Pandas 方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65430204/
我正在尝试从文本文件构建 boolean 值[][]。我正在读取每个字符,存储在 ArrayList 中(1 为真,0 为假)。我试过 ArrayList,但出现编译错误,意外元素。因此,我构建了一个
我想知道编程语言中的运算符优先级是否取决于实现,还是所有语言都遵循固定的规则。并且,如果可能的话,您可以先排序以下具有最高优先级的运算符吗:AND,OR,NOT,XOR。 最佳答案 我在Google上
这是同样的事情,对吗?还是有细微的差别?我只是想确保我没有误解任何事情。 最佳答案 通过简单地将 AND 替换为 OR 以及将 OR 替换为 AND 即可生成 boolean 对偶。补码本身不受影响,
我想这对于大多数优秀的程序员来说是微不足道的,但我已经习惯使用 true 进行编程。和 false 2、当我遇到0和1的时候,我永远记不住哪一个是真的,哪一个是假的。 有什么建议? 1好:I mean
我正在尝试将此 Java 示例转换为 Kotlin: Gson gson = new GsonBuilder() .registerTypeAdapter(Boolean.class,
下面的代码打印 true。 public static void main(String[] args) { Boolean test = false; test =
我在处理应该导致在 iReport 中显示或隐藏 strip 的表达式时遇到困难。 这些是我拥有的变量: Integer mainGroupInt = Integer.valueOf(5); Inte
以下编码错误可能是因为 Boolean equals(Object) 方法不需要 boolean/Boolean 参数: private void foo() { Boolean isSome
我想简化一个 boolean 表达式。 表达式是这样的 X1 xor (X2 || X3 && X4 || x5) 如何使用 boolean 代数规则简化此表达式。 而且我想将上面的 boolean
我正在使用一些工具,它可以确定特定事务是否成功的唯一方法是它是否通过了各种检查。但是,它的方式有限制,一次只能做一次检查,而且必须是顺序的。一切都必须从左到右计算。 例如, A || C && D 它
在大多数编程语言中,1和 0可以用来代替 True和 False .然而,根据我的经验,整数似乎总是更容易使用。 以下是我的意思的一些示例: if x is True: x = False else:
我有一个 boolean 方程,想简化它。帮忙解决一下。 bool needLoad = isA || (!isA && !isB); 之后我使用 if (needLoad){ if (
我认为这始终是正确的 x || (x && y) 相当于 x 如果是这样,那条法律叫什么?我什至不知道如何通过 Google 搜索该信息。 最佳答案 它被称为 Redundancy Law . A +
是否有任何现有的方法或功能模块可以有效地翻转 boolean 值? 如果我必须定义自己的实用方法,我想出了一个简单的实现,但我想知道这是否是最有效的方法: IF iv_bool = abap_true
我有这个表达式:X'YZ'+X'YZ+XY'Z'+XYZ'+XYZ('表示不是)我知道答案是 Y+XZ' 但我陷入了最后一部分。有人可以帮我吗? 这是我到目前为止得到的: X'YZ' + X'YZ +
openCL 支持 boolean 变量吗?我目前正在使用 JOCL (java) 编写我的 openCL 调用代码,但我没有看到任何有关 boolean 值的信息。 最佳答案 tl;dr:是的,但您
我认为这是对的 x || (x && y) 相当于 x 如果是这样,那条法律叫什么?我什至不确定我会如何使用 Google。 最佳答案 它叫做 Redundancy Law . A + A·B = A
我有一些功能,例如 (A and ( B or c)) or (D and E and (F or H or R or P ))) 我想将该函数转换为仅包含 and 操作的函数(当然如果可能的话)我发
我参加了编程面试,由 3 名面试官组成,每人 45 分钟。虽然前两位面试官给了我 2-3 个简短的编码问题(即反向链表、使用 rand(5) 实现 rand(7) 等),但第三位面试官使用了整个时间段
如果我只想检查某事是否不可能(即,我不会使用类似 if(possible) 的东西),我应该将 boolean 值命名为 notPossible并使用 if(notPossible)或者我应该命名它p
我是一名优秀的程序员,十分优秀!