- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个包含 k 个字符串列表的列表(这 k 个列表中的每一个都没有任何重复的字符串)。我们知道所有可能字符串的并集(假设我们有 n 个唯一的字符串)。
我们需要找到的是:最频繁的字符串对是什么(即,哪 2 个字符串在 k 个列表中一起出现的次数最多?第二频繁的字符串对,第三频繁的字符串对,等。此外,我想知道最常见的字符串三元组、第二常见的字符串三元组等。
我能想到的唯一算法非常复杂,基本上是为了解决最常见的对,我会从 n 个字符串 (O(n^2)) 中枚举出所有可能的对,并且对于它们中的每一个,检查有多少列表 (O(k)),然后我将对结果进行排序以获得我需要的结果,因此我的总体复杂度是 O(n^2.x),忽略最后一种。
关于时间方面更好的算法有什么想法吗? (这有望适用于字符串的三元组和字符串的四元组等)? Python 中的代码是最好的,但详细的伪代码(和数据结构,如果相关)或详细的总体思路也很好!
例如:如果
myList=[['AB', 'AC', 'ACC'], ['AB','ACC'],['ACC'],['AC','ACC'],['ACC','BB','AC']],
然后配对问题的预期输出将是:'AC','ACC' 是最常见的配对,'AB','ACC' 是第二常见的配对。
最佳答案
您可以使用 combinations
, Counter
和 frozenset
:
from itertools import combinations
from collections import Counter
combos = (combinations(i, r=2) for i in myList)
Counter(frozenset(i) for c in combos for i in c).most_common(2)
输出:
[(frozenset({'AC', 'ACC'}), 3), (frozenset({'AB', 'ACC'}), 2)]
关于python - 给定一个字符串列表列表,找到最常见的字符串对,第二个最常见的对,.....,然后是最常见的字符串三元组,等等,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64314450/
例如,我有一个父类Author: class Author { String name static hasMany = [ fiction: Book,
代码如下: dojo.query(subNav.navClass).forEach(function(node, index, arr){ if(dojo.style(node, 'd
我有一个带有 Id 和姓名的学生表和一个带有 Id 和 friend Id 的 Friends 表。我想加入这两个表并找到学生的 friend 。 例如,Ashley 的 friend 是 Saman
我通过互联网浏览,但仍未找到问题的答案。应该很容易: class Parent { String name Child child } 当我有一个 child 对象时,如何获得它的 paren
我正在尝试创建一个以 Firebase 作为我的后端的社交应用。现在我正面临如何(在哪里?)找到 friend 功能的问题。 我有每个用户的邮件地址。 我可以访问用户的电话也预订。 在传统的后端中,我
我主要想澄清以下几点: 1。有人告诉我,在 iOS 5 及以下版本中,如果您使用 Game Center 设置多人游戏,则“查找 Facebook 好友”(如与好友争夺战)的功能不是内置的,因此您需要
关于redis docker镜像ENTRYPOINT脚本 docker-entrypoint.sh : #!/bin/sh set -e # first arg is `-f` or `--some-
我是一名优秀的程序员,十分优秀!