- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我有一个对称函数 get_corr
,它使用两个字符串,并返回一个 double 值。
def get_corr(id1, id2):
# some magic to find double x
#...
return x
我还有一个字符串列表 factors
,我想用它生成一个大小为 len(factors)
xlen(factors)< 的对称矩阵
通过将 get_corr
应用于 factors
与自身的笛卡尔积。
这将非常简单,只需使用嵌套的 for
循环,遍历 factors
的索引,为每个位置调用 get_corr
。
corr_matr = np.identity(factor_length)
for i in factor_length:
for j in factor_length:
corr_matr[i,j] = corr_matr[j,i] = get_corr(factors[i], factors[j])
但是我觉得这一定有一些 NumPy 语法糖 - 是吗?我不认为它可以更快,但也许我错了。为此目的嵌套 for 循环似乎没有必要。我尝试使用 np.frompyfunc
并在 itertools.product
上调用它,但这看起来更糟,因为我将调用 get_corr
两次多次。此外,我无法使用 itertools.product
生成的元组序列正确矢量化该函数。
最佳答案
据我所知,在 numpy 中没有任何东西可以提高性能。 Numpy 非常快一旦您创建了一个数值数组。如果您有一个字符串列表和一个映射函数 string -> double
,那么您将不得不遍历这些条目。
一个选择是将您的映射转换为 Cython,并在其中写入转换,这可能会加快速度。
如果你想坚持使用 python 代码,itertools
有一些有趣的工具。正如您提到的,product
可能不会提供任何改进,因为您必须进行两次 map 计算(而且它是对称的)。但是,combinations
和 combinations_with_replacement
对我来说似乎是不错的选择。
如果您的相关函数总是将自相关映射到 1
(get_corr(i, i) = 1
) 则使用组合
,因为它会忽略对角元素,如果没有,使用 combinations_with_replacement
。
让我定义一个虚拟的类似相关性的字符串映射函数 -> double:
def get_corr(id1, id2):
diff = len(id1) - len(id2)
return 1. / (1. + diff * diff)
该函数既对称又测量相似性(1 表示长度相同的字符串,< 1 表示不同的字符串)。
字符串生成器函数(在 random strings 之后):
def random_strings(N, R):
return [''.join(choice(string.ascii_uppercase + string.digits)
for _ in range(randint(1, R)))
for _ in range(N)]
还有几个测试函数,你的:
def test1(data):
N = len(data)
corr_matr = np.identity(N)
for i in xrange(N):
for j in xrange(N):
corr_matr[i,j] = corr_matr[j,i] = get_corr(data[i], data[j])
return corr_matr
并使用组合
:
def test2(data):
N = len(data)
corr_matr = np.identity(N)
for (i, j) in combinations(xrange(N), 2):
corr_matr[i,j] = corr_matr[j,i] = get_corr(data[i], data[j])
return corr_matr
现在使用 100 个随机字符串进行一些基准测试:
>>> data = random_strings(100, 10) # 100 random strings
>>> %timeit -n3 test1(data)
3 loops, best of 3: 5.24 ms per loop
>>> %timeit -n3 test2(data)
3 loops, best of 3: 2.29 ms per loop
和 1000 个随机字符串:
>>> data = random_strings(1000, 10) # 1000 random strings
>>> %timeit -n3 test1(data)
3 loops, best of 3: 452 ms per loop
>>> %timeit -n3 test2(data)
3 loops, best of 3: 232 ms per loop
使用 itertools(具有相当简单的映射函数)速度是原来的两倍。
关于python - 将两个参数函数应用于列表以使用 NumPy 生成对称矩阵,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37186223/
简而言之:我想从可变参数模板参数中提取各种选项,但不仅通过标签而且通过那些参数的索引,这些参数是未知的 标签。我喜欢 boost 中的方法(例如 heap 或 lockfree 策略),但想让它与 S
我可以对单元格中的 excel IF 语句提供一些帮助吗? 它在做什么? 对“BaselineAmount”进行了哪些评估? =IF(BaselineAmount, (Variance/Baselin
我正在使用以下方法: public async Task Save(Foo foo,out int param) { ....... MySqlParameter prmparamID
我正在使用 CodeGear RAD Studio IDE。 为了使用命令行参数测试我的应用程序,我多次使用了“运行 -> 参数”菜单中的“参数”字段。 但是每次我给它提供一个新值时,它都无法从“下拉
我已经为信用卡类编写了一些代码,粘贴在下面。我有一个接受上述变量的构造函数,并且正在研究一些方法将这些变量格式化为字符串,以便最终输出将类似于 号码:1234 5678 9012 3456 截止日期:
MySql IN 参数 - 在存储过程中使用时,VarChar IN 参数 val 是否需要单引号? 我已经像平常一样创建了经典 ASP 代码,但我没有更新该列。 我需要引用 VarChar 参数吗?
给出了下面的开始,但似乎不知道如何完成它。本质上,如果我调用 myTest([one, Two, Three], 2); 它应该返回元素 third。必须使用for循环来找到我的解决方案。 funct
将 1113355579999 作为参数传递时,该值在函数内部变为 959050335。 调用(main.c): printf("%d\n", FindCommonDigit(111335557999
这个问题在这里已经有了答案: Is Java "pass-by-reference" or "pass-by-value"? (92 个回答) 关闭9年前。 public class StackOve
我真的很困惑,当像 1 == scanf("%lg", &entry) 交换为 scanf("%lg", &entry) == 1 没有区别。我的实验书上说的是前者,而我觉得后者是可以理解的。 1 =
我正在尝试使用调用 SetupDiGetDeviceRegistryProperty 的函数使用德尔福 7。该调用来自示例函数 SetupEnumAvailableComPorts .它看起来像这样:
我需要在现有项目上实现一些事件的显示。我无法更改数据库结构。 在我的 Controller 中,我(从 ajax 请求)传递了一个时间戳,并且我需要显示之前的 8 个事件。因此,如果时间戳是(转换后)
rails 新手。按照多态关联的教程,我遇到了这个以在create 和destroy 中设置@client。 @client = Client.find(params[:client_id] || p
通过将 VM 参数设置为 -Xmx1024m,我能够通过 Eclipse 运行 Java 程序-Xms256M。现在我想通过 Windows 中的 .bat 文件运行相同的 Java 程序 (jar)
我有一个 Delphi DLL,它在被 Delphi 应用程序调用时工作并导出声明为的方法: Procedure ProduceOutput(request,inputs:widestring; va
浏览完文档和示例后,我还没有弄清楚 schema.yaml 文件中的参数到底用在哪里。 在此处使用 AWS 代码示例:https://github.com/aws-samples/aws-proton
程序参数: procedure get_user_profile ( i_attuid in ras_user.attuid%type, i_data_group in data_g
我有一个字符串作为参数传递给我的存储过程。 dim AgentString as String = " 'test1', 'test2', 'test3' " 我想在 IN 中使用该参数声明。 AND
这个问题已经有答案了: When should I use "this" in a class? (17 个回答) 已关闭 6 年前。 我运行了一些java代码,我看到了一些我不太明白的东西。为什么下
我输入 scroll(0,10,200,10);但是当它运行时,它会传递字符串“xxpos”或“yypos”,我确实在没有撇号的情况下尝试过,但它就是行不通。 scroll = function(xp
我是一名优秀的程序员,十分优秀!