Python - 生成符合条件的大型集合组合的最有效方法？-6ren

Python - 生成符合条件的大型集合组合的最有效方法？

转载作者：行者123 更新时间：2023-11-28 16:29:16

25

4

我试图在受边界条件约束的投资组合中生成所有可能的金融工具组合。

例如，假设我有一组列表，这些列表代表对投资组合的分配，每个工具受总投资组合规模的最小和最大百分比限制:

"US Bonds" = {0.10,0.15,0.20,0.25,0.30}
"US Equities" = {0.25, 0.30, 0.35, 0.40, 0.45, 0.50}
"European Bonds" = {0.10, 0.15, 0.20}
"European Equities = {0.20,0.25,0.30,0.35,0.40,0.45,0.50}
 ...
"Cash" = {0.0, 0.05, 0.10, 0.15,...0.95}

我的 list 、 Assets 如下所示:

[In]
Asset

[Out]
[[0.1, 0.15, 0.2, 0.25, 0.30],
[0.25, 0.30,0.35, 0.40, 0.45, 0.50],
[0.1, 0.15, 0.2],
[0.20, 0.25, 0.30,0.35, 0.40, 0.45, 0.50]
...
[0.0, 0.05, 0.1, 0.15, 0.2, 0.25,...0.95]]

根据每个工具组合的总和必须 = 1 的标准，生成所有可能的投资组合的最有效方法是什么？

现在，我正在创建一个“投资组合”列表，如下所示:

portfolios  = [item for item in itertools.product(*asset) if  np.isclose(sum(item),1)]

(nb，'np.isclose' 处理时髦的 fp 算术)。

我已经将 Assets 类别和可能的分配表示为列表的集合，但想知道是否有不同的数据表示(例如，NumPY 数组)会更快。

有一些关于各种组合的最佳执行的问题，但我没有看到有任何边界条件的问题。

最佳答案

(注意:代码位于:http://lpaste.net/145213)

首先，我会将百分比表示为整数值以避免浮点舍入错误。

其次，最有效的方法是使用边界来避免查看不可能满足 == 1 约束的投资组合。

您要编写的循环将像这样运行:

def portfolios():
  for us_bonds in [ 10, 15, 20, 25, 30 ]:
    if us_bonds > 100: break
    for us_equaties in [ 25, 30, 35, 40, 45, 50 ]:
      if us_bonds + us_equaties > 100: break
      for euro_bonds in [ 10, 15, 20 ]:
        if us_bonds + us_equaties + euro_bonds > 100: break
        for euro_equaties in [ 20, 25, 30, 35, 40, 45, 50 ]:
          if us_bonds + us_equaties + euro_bonds + euro_equaties > 100: break
          cash = 100 - (us_bonds + us_equaties + euro_bonds + euro_equaties)
          yield [us_bonds, us_equaties, euro_bonds, euro_equaties, cash]

这定义了一个生成器，您可以像这样在 for 循环中使用它:

for x in portfolios(): print x

这种方法是有效的，因为它避免了构建超过 == 100 限制的投资组合。

另请注意，我们利用了“现金”百分比基本上可以是任何东西这一事实 - 因此它只占 100% 与其他投资类别总数之间的差额。

以下函数将此循环概括为任意数量的投资类别:

def gen_portfolio(categories):
  n = len(categories)
  tarr = [0] * (n+1)
  parr = [0] * (n+1)
  karr = [0] * (n+1)
  marr = [ len(c) for c in categories ]
  i = 0
  while True:
    while True:
      if i < n:
        p = categories[i][ karr[i] ]
        t = tarr[i] + p
        if t <= 100:
          parr[i] = p
          tarr[i+1] = t
          i += 1
          karr[i] = 0
          continue
        else:
          break                   # backup
      else:
        parr[n] = 100 - tarr[n]   # set the Cash percentage
        yield parr[:]             # yield a copy of the array parr
        break
    # backup
    while True:
      if i > 0:
        i -= 1
        karr[i] += 1
        if karr[i] < marr[i]: break
      else:
        return  # done!

def portfolios2():
  cats = [ [ 10, 15, 20, 25, 30 ], [ 25, 30, 35, 40, 45, 50 ], [ 10, 15, 20 ], [ 20, 25, 30, 35, 40, 45, 50 ] ]
  return gen_portfolio(cats)

这里有一个测试表明它们产生了相同的结果:

def compareTest():
  ports1 = [ x for x in portfolios() ]
  ports2 = [ x for x in portfolios2() ]
  print "ports1 length:", len(ports1)
  print "ports2 length:", len(ports2)
  for x in ports1:
    if x not in ports2: print "not in ports2:", x
  for x in ports2:
    if x not in ports1: print "not in ports1:", x

更新

下面是一个示例，演示了此方法与 itertools.product 之间的区别。

假设有 10 个投资类别，每个类别的百分比为 [90,91,..,99]。带有 break 语句的嵌套循环将按如下方式进行:

start the loop: for p1 in [90,91,..,99]

  set p1 = 90
  p1 < 100 so continue

  start the loop: for p2 in [90,91,..,99]
    set p2 = 90
    p1 + p2 > 100, so break out of the p2 loop

  set p1 = 91

  p1 < 100 so continue
  start the loop: for p2 in [90,91,..,99]
    set p2 = 90
    p1 + p2 > 100, so break out of the p2 loop
  set p1 = 92
  ...

所以带有 break 语句的嵌套循环只查看 10 种情况 - p1 = 90, 91, .., 99 和 p2 = 90。p2 永远不会大于 90 并且它永远不会尝试将任何东西分配给 p3,p4, ...，第 10 页。

另一方面，itertools.product 将生成所有 100 个案例，然后您必须过滤掉那些总和 > 100 的组合。

对于某些输入，itertools.product 可能更快，因为它是用 C 编写的，但它不会根据当前选择的总和对案例进行任何修剪。

关于Python - 生成符合条件的大型集合组合的最有效方法？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/33704780/

25

4

0

文章推荐： python - 如何在 Python 中对数据框的特定行求和

文章推荐： javascript - jquery设置错误RequestUrl的问题

文章推荐：具有动态开始和结束变量的 JavaScript 循环

SwiftUI 符合 Hashable
我们如何让 SwiftUI 对象，尤其是 Image，符合 Hashable 协议(protocol)？我知道它们符合 Equatable 协议(protocol)，所以主要问题是如何获取哈希值，或
ios - 符合 AVAudioPlayerDelegate
我遇到了一些符合 AVAudioPlayerDelegate 的奇怪问题。以下正是我在一个全新的 Xcode 项目中所拥有的: import UIKit import AVFoundation cla
swift - 符合 NSCoding
我一辈子都弄不明白为什么我会收到此类不符合 NSCoding 协议(protocol)的错误。也许另一双眼睛会有所帮助。我试图添加注释以明确每个函数在做什么。 import Foundation im
符合 C 标准的结构对齐方式
关闭。这个问题需要details or clarity .它目前不接受答案。想改进这个问题吗？通过 editing this post 添加细节并澄清问题. 关闭 9 年前。 Improve t
xhtml - 符合 XHTML 的意义何在？
所有现代浏览器都理解 HTML，所以除了在键盘最右侧编写更多字符之外，兼容 XHTML 的意义何在。最佳答案没有一点我能想到的。 W3C 已经取消了 XHTML 2.0，尽管应该有一个 XHTML
oop - 符合 Liskov 的状态设计模式
我正在设计一个订单系统，状态设计模式似乎很合适，因为订单可以更改其状态，从而更改订单允许的功能。下面是我的基本类图: 我不喜欢这种方法，因为客户端无法查看某个方法是否受支持并且违反了里氏原则。我在下面
neo4j - 符合 neo4j 中的模式
我正在考虑使用图形数据库来存储 IFC数据。理想情况下，数据库应该提供一种方法来定义 IFC 架构中定义的所有规则类型。但是，我不认为有任何这样的数据库，因为 IFC 中的某些规则类型非常复杂并且需要
fips - 符合 FISMA/其他联邦信息系统要求的散列算法
我所在的组织必须满足 FISMA 对启用 FIPS 的系统的要求。我正在尝试做的一件事是为我们的密码实现哈希算法。我对此有很多选择:SHA-2、MD5、bcrypt(使用 Blowfish)、RIPE
Swift:CoreData 符合 MKAnnotation
我正在尝试实现我的自定义 CoreData Carpark 实体以符合 MKAnnotation，就像我们如何使 class 对象符合 >MKAnnotation. 我根据以下帖子调整了我的实现:th
swift - 符合 'CBCentralManagerDelegate'协议(protocol)
我在 project-Swift.h 文件中收到名为“CBCentralManagerDelegate”的 No 类型或协议(protocol)。不知道我在这里哪里出错了。我认为这与 swift.h
c++ - 从原始内存中读取值(符合 MISRA)
我正在尝试读取之前写入 NVM 闪存的变量的值。我的代码是: uintptr_t address = getAddress(); //[MISRA C++ Rule 5-2-8] cast from
java - 符合 .implements 的数组
所以我有这个练习要解决。我必须创建第一个。一个名为 Printable 的接口(interface)，它有一个 put() 方法，该方法将接受实现 Comparable 的对象。完成 interfa
c - 符合 IEEE754 的结构
我的问题涉及 IEEE 754 单精度数字。假设我有一个结构: typedef struct __ieee754 { int sign; int exponent; int mant
c++ - 符合 STL 的内存分配器库
我需要使用 map，键为 uint32_t，值为 Meshes。我希望将网格布局在连续的内存中以 boost 性能，因为它们将经常被连续访问。我想知道有哪些内存分配器库可以提供以下内容；分配给连续
符合 C++ STL 的分配器
在处理小对象时，有哪些分配器可用于 STL。我已经尝试过使用 Boost 的池分配器，但没有得到任何性能提升(实际上，在某些情况下性能下降相当大)。最佳答案你没有说你使用的是什么编译器，但它可能带
符合 c++ STL 的迭代器迭代器
我想做什么我有一种划分事物的方法。此方法不会对数组进行完全排序；它只是简单地对数组进行分区，以便一侧的所有元素(某些预先确定的“中心”或“中点值”——但它不必导致均匀拆分)小于“中心”和另一侧的所有
http - 符合 RESTful 标准的设计
假设我需要开发一个 REST 银行应用程序允许创建/销毁银行账户以及对帐户进行以下操作:withdraw/credit/getBalance。创建帐户 PUT/银行/约翰这里我使用 PUT 而不是
ios - 符合 Equatable 的单元测试策略
假设我有一个 struct 符合我的模型的 Equatable，如下所示: struct Model: Equatable { var a: Int = 0 var b: String
swift - 符合 Decodable 的类不需要初始化器
我目前正在研究 Decodable、Encodable 和 friend ，试图理解它背后的“魔法”。以下是我发现不寻常的一件事: class Person: Decodable { var n
swift - 符合 RawRepresentable 的枚举
在 Swift 书中，枚举的例子很好用 enum CompassPoint: String { case north, south, east, west } var northCom = C

首页

博学

6Ren·AI

商城

Python - 生成符合条件的大型集合组合的最有效方法？