python - 从列表中消除半重复项的高性能方法-6ren

python - 从列表中消除半重复项的高性能方法

转载作者：行者123 更新时间：2023-11-28 16:47:01

25

4

我有一系列的谜题: 字母或单词之间没有空格的莫尔斯电码字符串。我的计划是进行字典攻击以找到最佳解决方案候选者。我的武器是 Python。

我有一个包含 17000 个英语单词的列表。我还有一个小得多的与拼图主题相关的单词列表，如果这些单词出现，它们应该得分更高。

因此，在我的脚本最开始生成单词列表时，我使用了 (word, scoremultiplier) 形式的元组列表。这是一小部分:

[('zoned', 1.0), 
 ('zonely', 1.0), 
 ('zoner', 1.0), 
 ('zones', 1.0), 
 ('zoning', 1.0), 
 ('zoo', 1.0), 
 ('zoom', 1.0), 
 ('zoomed', 1.0), 
 ('zooming', 1.0), 
 ('zooms', 1.0), 
 ('zoos', 1.0), 
 ('ten', 1.0), 
 ('tens', 1.0), 
 ('gnash', 1.0), 
 ('shag', 1.0), 
 ('75th', 2.0), 
 ('seventy', 2.0), 
 ('fifth', 2.0)]

在我解析所有内容的文件中，我只想将高值(value)的词放在最后，而不是手动删除文件主要部分中的任何重复项。所以我需要写一些东西来摆脱第一个值等于后面的元组的早期元组。

我可以用蛮力做到这一点:

for firstkey, (firstword, firstfactor) in enumerate(wordlist):
    for laterkey, (laterword, laterfactor) in enumerate(wordlist[firstkey+1:]):
        if firstword == laterword:
            del wordlist[firstkey]
            break

但仅脚本的那部分就需要将近 45 秒，而我的 17000 个单词甚至不是完整的字典。 (除了完成所需的时间之外，该代码也未经测试，因此它甚至可能无法工作。)它似乎也非常不符合 Python，尽管我刚刚开始学习 Python(并且根本没有进行一些我的第一次编程)有了这个项目。

有更好的方法吗？我不能使用 set()，因为重复的单词是不相等元组的一部分。我是否需要以某种方式重组我的数据？还是我应该准备好在每次运行时等待整整一分钟？

最佳答案

我可能误解了这个问题，但看起来您可以从元组列表生成一个 dict。后面的值会自动覆盖前面的值:

lst = [
    ('foo', 1),
    ('bar', 2),
    ('foo', 10)
]

print dict(lst) # {'foo': 10, 'bar': 2}

关于python - 从列表中消除半重复项的高性能方法，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/12886611/

25

4

0

文章推荐： javascript - 如何搜索嵌套级别的 JSON 数组

文章推荐： python - Getpass 错误

文章推荐： asp.net - Visual Studio 2010 不遵循我的 CSS ...帮助请

文章推荐： javascript - 如何检查 props 中的元素是否匹配条件？

java - 高性能
很难说出这里问的是什么。这个问题是含糊的、模糊的、不完整的、过于宽泛的或修辞性的，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开它，visit the help center 。已关
javascript - 高性能 - 在对键进行排序时将对象转换为数组
我有以下对象: var myObj = { "4":{//The key is a number String. id:4,name
c++ - 在字典中查找单词模式，高性能
我需要构建某种字典，其中还包含每个单词在该语言中出现的单词频率。通常，这将使用 std::unordered_map 来实现，对吧？现在问题来了……我想找到所有符合某些正则表达式的单词及其频率，而性能
高并发、高性能、高可用系统设计经验
软件开发通常会提到一个名词 “三高”，即高并发、高性能、高可用。具体的指标定义，如：高并发方面要求QPS 大于 10万；高性能方面要求请求延迟小于 100 ms；高可用方面要高于 99.99
performance - 高性能 WebGL 框架
我有一个大约有 108000 个三角形的网格，应该用 WebGL 渲染。目前我不使用框架，只使用纯 WebGL。我已经通过 id 映射实现了对象识别，以便使用回调功能和基本的相机操纵器进行拾取。现
javascript - 高性能 Javascript 固定滚动
我读过无数的帖子，无数次地重写过代码，我发现自己碰壁了。由于应用了 CSS scale3d 转换的容器，我试图克服在滚动页面时不使用 CSS 固定元素位置的限制。虽然我最新的解决方案有效，但它有时仍然
performance - 高性能 SQLite 的选项
我正在开发一个嵌入式系统，它需要非常频繁地存储和检索数据。我预计每秒可能有 100 次写入和 10 次读取。数据将以突发而不是连续的方式到达。我想使用 SQLite 来存储所有这些数据，但由于它是一
javascript - 在网络应用程序中处理事件跟踪的最佳(高性能)方法
当前情况在我们的一款 SPA Web 应用程序中，我们使用自定义跟踪器请求来跟踪各种用户操作，例如 cta 点击、页面导航等，该请求将一些信息传递到后端使用 POST 请求。问题现在，因为这些跟
haskell - 高性能 Haskell 哈希结构。
我正在编写执行大量表查找的程序。因此，当我偶然发现 Data.Map (当然)，以及 Data.HashMap 和 Data.Hashtable 时，我正在仔细阅读 Haskell 文档>。我不是散列
performance - 高性能 BPEL 引擎？
我正在评估我们的高性能电信应用程序的 BPEL 引擎，但性能似乎很差。我们评估了 Apache Ode、SunBPEL 引擎、Active BPEL 等。您知道任何更快的 BPEL 引擎实现或 C/C
c# - 高性能 mysql INSERT
我目前正在重写一个旧的 ASP\ASP.NET 应用程序。由于我无法完全重写，所以我需要分部分进行。现在我正在将代码库从 ODBC 升级到 .net 连接器。有一个函数可以在用户每次访问页面时进行一
javascript - 高性能 dom 添加和删除
旁注:我正在使用 JQuery，但没有使用任何第三方表格组件(我现在也不能)。我的问题是我应该能够显示很多(10000)条经过的消息——每秒都会有数百条新消息，它们应该被添加到底部。当我们达到 10
mysql - 高性能 mysql 行内文本字段
为了争论，假设我试图在 MySQL 表中表示一个非常简单的文件系统。请注意，这并不是我正在做的，它只是为问题的简单基础做准备。所以不要费心告诉我存储文件的更好方法。该表的架构如下: varchar p
python - 超越循环:高性能，大格式的数据文件解析
我希望优化我使用python时遇到的大数据解析问题的性能。以防有人感兴趣：下面显示的数据是六种灵长类动物全基因组DNA序列比对的片段。目前，我知道如何处理这类问题的最好方法是打开我的~250（大小2
ruby - 高性能 ETL 平面文件提取的更好解决方案？
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题，以便用事实和引用来回答。关闭 7 年前。
ruby - 高性能 Ruby 列表框
我需要用 Ruby 制作一个小应用程序，它将以不同颜色显示通过 TCP 接收的日志行。推荐用于此类应用的 GUI 框架是什么？我应该在 Windows 和 Linux 上工作。最佳答案 Shoes
concurrency - 高性能(但笨拙)的网络服务器
我正在尝试编写一个非常简单的 Web 服务器来执行以下操作: 接收请求。响应一个小文件；关闭连接。处理请求数据。换句话说，响应不依赖于请求信息，但请求信息仍然很重要。数据将被保留，然后用于分析。
c# - 高性能 WebSocket 游戏服务器的单点登录？
我正在使用 WebSocket 协议(protocol)(通过 WebSocketSharp)开发 C# 游戏服务器。目前，每当用户登录游戏时，我都会创建一个 token 并将其添加到 Concurr
java - 高性能 hibernate 插入
我正在处理应用程序的延迟敏感部分，基本上我会收到一个网络事件来转换数据，然后将所有数据插入到数据库中。在分析之后，我发现基本上我所有的时间都花在了保存数据上。这是代码 private void ins
c++ - 高性能 QImage 输出显示
我正在尝试将视频输出(帧序列)输出到任何 qt 可见小部件。一开始我认为 QLabel 就足够了......但我错了。转换为像素图对于大型图像的处理器来说过于过载:例如 1080p。还有其他解决方案

首页

博学

6Ren·AI

商城

python - 从列表中消除半重复项的高性能方法