algorithm - 标识文件的最少字节-6ren

algorithm - 标识文件的最少字节

转载作者：塔克拉玛干更新时间：2023-11-03 03:32:32

24

4

我目前正在做一个小项目，结果证明这是一个挑战。这是设置:我有一个相当旧的处理器，用于各种产品。大约有 500 个不同的固件版本用于各种应用程序。它们有时相差几个字节~1k，其他时候只有 5%。现在我想通过为它创建一个唯一的标识符来识别每个版本。我有可用的固件二进制文件作为工作和训练的文件。

目标是，当有任何设备经过时，我想读出尽可能少的已安装固件字节，因为 9600 波特的连接速度相当慢。尽管固件总共只有 64k 左右，但完全读取它需要相当长的时间(由于协议(protocol)开销、时钟速度等原因，大约需要 5 分钟)

我在考虑一些逻辑，它会解析存储的固件文件并确定哪些字节可用于唯一标识它。每当设备经过时，它都会依次读取每个指纹字节，这与旧的 T9 文本预测非常相似，以缩小候选范围，直到找到正确的固件。为此，我需要建立一个包含最优化的指纹字节集的数据库。但是如何训练呢？如何找到超过 500 个文件的最重要字节？

到目前为止，我已经尝试对文件进行统计分析并找到文件之间差异最大的前 50 个字节。问题是，即使占用 50 个字节，我也会得到创建相同散列的多个版本。

非常欢迎任何可能解决问题的建议或算法!如果您对此有一个完全不同的想法，我很乐意听听!

最佳答案

识别值可能不同的所有字节位置。然后找到“最有效的拆分器”，即探测值会将当前集合拆分为最小子集(在 minmax 意义上)或更多子集的位置。

然后递归地对每个子集重复整个过程。这将产生一个决策树，为您提供(希望是短的)字节序列进行测试。

这是一种启发式方法，可能不是最优的，我希望

计算过程不会太长(虽然它会一次性运行)，
它与最佳状态相差不远。

假设每次拆分都是平衡的，但每次都产生两个子集，则测试序列不会超过 10 个字节。

关于algorithm - 标识文件的最少字节，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/54362417/

24

4

0

文章推荐： java - 使用 Commons-compression 在 Java 中读取 tar.gz

文章推荐： java - 事务不回滚

R RecordLinkage 标识
我正在 R 中使用 RecordLinkage 库。我有一个包含 ID、姓名、电话、邮件的数据框我的代码如下所示: ids = data$id pairs = compare.dedup(data
ASP.NET 标识
我目前正在构建一个新的 ASP.NET MVC 5 项目，我想在 9 月左右发布。我需要选择一个成员(member)系统，但我目前对我应该采取哪个方向感到很困惑。当前的 SimpleMembershi
标识 COBOL 中部分的正则表达式
我正在为 Brackets 定制一个大纲插件，它使用正则表达式来识别当前打开的文件的大纲。我使用 regex101.com 创建了以下正则表达式(使用环视来确定该行以七个空格开头并以“SECTION
带有前导填充零的 SQL 标识
我已在表中将一列标记为“身份” create table Identitytest( number int identity(1,001) not null, value varch
c - 标识 : Is that a string?
我不知道那是字符串还是数组... char str4[100] = { 0 }; 那个代码是字符串？如果是，它打印什么？最佳答案 I dont know if that a string or a
C# ASP.NET 标识
我这里有一个场景，当用户想要重置密码时，系统必须通过电子邮件向用户发送一个随机生成的临时密码。我尝试将临时密码存储到数据库中的一个新列中，但我不确定这种方法是否有效。有些人建议使用 token，如下所
c++ - Vista 窗口标题中的图片(标识)
Vista 的现代 Windows 应用程序中有一个很好的功能。它是窗口标题中的图片。例如新的 skype (v4) 和 google chrome 都有它。我在想它背后的技术是什么？如果你关闭 a
c# - C# 中的通用值相等(标识)
比较相同泛型类型的两个实例的最佳(最简洁和最佳)方法是什么，以便比较引用类型的身份(相同的对象，所以不是调用 Equals) 和 value 类型以获得值 equality。目前我这样做: stat
c# - 虚拟机上的 CPU 标识
我使用以下 C# 代码来获取处理器信息。如果我在虚拟机上运行我的应用程序，则管理类为空。我使用 Oracle VM VirtualBox 作为我的虚拟电脑 (Windows XP SP3) Syste
windows-identity - Windows 标识 SID
创建帐户后，Windows 帐户(本地、域、Active Directory)的 SID 是否会更改？如果是，在什么条件下。最佳答案是的，当您将帐户迁移到新域时，它会发生变化。这就是您 AD 帐
identityserver4 - 自定义 ASP.NET 标识
我正在使用 Identity Server 4 并且我已经自定义了我的 ASP.NET Identity 用户，如下所示: public class ApplicationUser : Identit
iis - IIS 何时创建 AppPool 标识？
我创建了一个 IIS 管理工具，旨在创建新应用程序、将它们分配到新的 AppPool，并为与该 AppPool 关联的身份添加所需的文件夹 ACL。根据this article ，每当创建新的应用程序
ASP.NET 标识 session 超时
我使用 ASP.NET Identity .. 我想将 session 超时设置为无限制或最大值。我试过一些东西，但没有效果。注意:我使用共享主机。谢谢你。 //web.config /
iis - 找不到 IIS AppPool 标识
我有一台 Win 2008 R2 Enterprise 机器，它在几个网站上运行良好，每个网站都有自己的应用程序池。我在向 IIS AppPool\A、IIS AppPool\B 等授予权限(使用
c# - ASP.NET 标识 - 简化
现有数据库模型(简化): 1 个用户可以加入 1 个或多个访问组。 1个AccessGroup可以有1个或多个AccessItens。 MSDN Says: When an identity is c
java - JPA 单表层次结构中的 PostgreSQL 标识
在具有单个表继承层次结构的 Hibernate/JPA 环境中使用 PostgreSQL 时，我看到了奇怪的行为。首先是我的环境: PostgreSQL 8.3 Spring 2.5.6SEC01
java - Java 中的类是否具有(唯一)标识？
是声明“一个类具有唯一标识”。是真是假？ Java 中的对象有其唯一标识(至少通过它们的内存地址)，但是类也有唯一标识吗？由于类不是对象，我对此感到困惑。或者是否需要实例化一个类(甚至可能)？最佳答
c# - 微服务架构中的 ASP.NET 标识
我正在尝试通过将主要组件分解为单独的网络服务器来使用微服务架构来实现网络应用程序。我正在使用 ASP.NET Identity(仅电子邮件/用户名登录，无 Facebook 等)和“主”应用程序服务器
database - GUID 与 INT 标识
这个问题在这里已经有了答案: 关闭 10 年前。 Possible Duplicate: How do you like your primary keys? 我知道使用 GUID 的好处，以及使用
c# - 获取角色内的所有用户。 ASP.NET 标识
我可以这样获取所有用户 var users = UserManager.Users.ToList(); 我能找到这样的角色 var role = db.Roles.SingleOrDefault(m

首页

博学

6Ren·AI

商城

algorithm - 标识文件的最少字节