c - 使用整个 unicode 库的 LZW 压缩-6ren

c - 使用整个 unicode 库的 LZW 压缩

转载作者：太空宇宙更新时间：2023-11-04 02:58:28

25

4

我正在尝试做这道题:

Assume we have an initial alphabet of the entire Unicode character set, instead of just all the possible byte values. Recall that unicode characters are unsigned 2-byte values, so this means that each 2 bytes of uncompressed data will be treated as one symbol, and we'll have an alphabet with over 60,000 symbols. (Treating symbols as 2-byte Unicodes, rather than a byte at a time, makes for better compression in the case of internationalized text.) And, note, there's nothing that limits the number of bits per code to at most 16. As you generalize the LZW algorithm for this very large alphabet, don't worry if you have some pretty long codes.

With this, give the compressed version of this four-symbol sequence, using our project assumptions, including an EOD code, and grouping into 4-byte ints. (These three symbols are Unicode values, represented numerically.) Write your answer as 3 8-digit hex values, space separated, using capital hex digits, not lowercase.

32767 32768 32767 32768

我遇到的问题是我不知道字母表的整个范围，所以在进行 LZW 压缩时我不知道新代码将具有什么字节值。由于这个问题，我也不知道 EOD 代码会是什么。

此外，在我看来，压缩数据只需要两个整数。

最佳答案

问题陈述格式错误。

在我们今天所知道的 Unicode 中，代码点(那些代表字符、字符的可组合部分和其他有用但更隐蔽的东西的数字)不能全部从 0 到 65535 编号以适应 16 位。 Unicode 中有超过 10 万个中文、日文和韩文字符。很明显，你需要 17+ 位才能满足这些需求。因此，Unicode 显然不是这里的正确选项。

OTOH，存在一种 Unicode 的“删节”版本，Universal Character Set ，其 UCS-2 编码使用 16 位代码点，技术上最多可用于 65536 个字符等。那些代码大于 65535 的字符是不吉利的，UCS-2 不能使用它们。

因此，如果它真的是 UCS-2，您可以下载它的规范(我相信是 ISO/IEC 10646)并找出使用了这 64K 中的哪些代码，因此应该构成您的初始 LZW 字母表。

关于c - 使用整个 unicode 库的 LZW 压缩，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/14801866/

25

4

0

文章推荐： javascript - WebStorm Javascript 外部库 - Node.js

文章推荐： css - 如何在一行中获取第 th 个标签的内部？

文章推荐： node.js - 使用单个命令进行查询和插入

文章推荐： c - msync 是原子的吗？

java 库 vs android 库
Java 库和 android 库有什么区别，各自有什么优点/缺点？最佳答案您可以在 Android 应用程序中包含标准 Java .jar 文件库。它们在 .apk 构建时被翻译成 Dalvik
java - 如何从另一个 native 库 (.so) 加载 native 库 (.so)？
所以，我现在的代码就像从 Java 层加载库(比如 liba.so)，并在内部 liba.so 加载 libb.so。因此，如果我必须将所有库打包到 APK 中并将其安装在没有 root 访问权限的设
c++ - LEDA 库(C++ 库)设置 linux
我想在我的系统中设置 LEDA 库。我已经从以下链接下载了 LEDA 库 http://www.algorithmic-solutions.info/free/d5.php Instruct
shared - 如何使用 autoconf 制作 .so 库，而不是 .la 库？
我想用 autoconf 创建一个共享库。但是，我希望共享库具有“.so”扩展名，而不是以“lib”开头。基本上，我想制作一个加载 dlopen 的插件。 .是否有捷径可寻？当我尝试使用 autoc
pdf - 如何在 Apps 脚本中使用外部 Javascript 库(PDF 库)？
我需要在 Apps 脚本应用程序上修改 PDF。为此，我想使用 JS 库:PDF-LIB 我的代码: eval(UrlFetchApp.fetch("https://unpkg.com/pdf-lib
c++ - 可序列化的 Boost 库 header 和仅 header 库
我正在构建一个使用以下 Boost header 的程序(我使用的是 Microsoft Visual C++ 10)， #include #include #include #include
java - 无法为您的平台加载 native-hadoop 库...未加载 Snappy native 库
当我通过 cygwin 在 hadoop 上运行此命令时: $bin/hadoop jar hadoop-examples-*.jar grep input output 'dfs[a-z.]+' 我
c++ - GHCi 无法在 Windows 上加载 .dll 库(C++ 库)
我已经通过 vcpgk 成功安装了一个 C++ 库，名为:lmdb:x64-windows 我还安装了lmdb通过 Cabal 安装的 Haskell 绑定(bind)包在尝试测试 lmdb 包时:
java - 库 'javacv-android-arm.jar' 包含不会在设备上运行的 native 库
我该如何解决这个问题？我刚刚将 javacv jar 文件复制到我的项目 Lib 文件夹下，但出现了这个错误! 我可以找到这个thread来自谷歌，但不幸的是，由于我国的谷歌限制政策，该页面无法打开
android - Android 库 JAR 可以依赖于 Android 库 AAR 吗？
我有一个 Android 库项目 FooLib。 FooLib 引用 Android Context 之类的东西，但不需要任何资源文件(res/ 中的东西)所以我目前将其打包为供我的应用使用的 JAR
java - GRT 库，以及如何在 Android Studio 上导入 native 库
我正在开发一个 Android 应用程序(使用 Android Studio)，它能够通过手势识别算法了解您正在进行的 Activity 。对于我使用 nickgillian ithub 帐户上可用的
c# - NetFramework 应用程序在同一解决方案中引用 NetFramework 库，在另一个解决方案中引用 NetStandard 库。 : could not load file or assembly
关于从 .NET Framework 项目中引用 .NET Standard 类库的问题有很多类似的问题，其中 netstandard 库中的 NuGet 包依赖项不会流向 netframework
java - 库 'jna-4.2.2.jar' 包含不会在 Android 设备上运行的 native 库
我已经从互联网上下载了 jna-4.2.2.jar，现在想将这个 jar 导入到我的项目中。但是当我试图将这个 jar 导入我的项目时，出现以下错误。 [2016-06-20 09:35:01 - F
macos - 如何在 Mac 上完整(具有所有功能 - ACL 支持/Xattr 支持/xxhash 库/zstd 库)安装(编译)rsync v3.2.3？
我正在尝试通过编译在 Mac 上安装 rsync 3.2.3。但是，我想安装所有功能。为此，它需要一些库，此处 ( https://download.samba.org/pub/rsync/INSTA
JavaScript 库
进入 Web 开发有点困难。过去 5 年我一直致力于 winforms 工作。所以我正在努力从一种切换到另一种。前段时间，我使用过 JavaScript，但现在还没有大量的 JavaScript 库
模仿matlab功能的C++库
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开，visit the help center . 关闭 1
Python日志分析工具/库
我正在寻找一个用Python编写的与logstash(ruby + java)类似的工具/库。我的目标是: 从 syslog 中解析所有系统日志解析应用程序特定日志(apache、django、m
JavaScript 库
就目前情况而言，这个问题不太适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持，但这个问题可能会引发辩论、争论、民意调查或扩展讨论。如果您觉得这个问题可以改进并可能重新开放，visit
JavaPOS 库
我花了几天时间试图寻找用于 JavaPOS 实现的 .jar 库，但我找不到任何可以工作的东西。我找到了很多像这样的文档:http://jpos.1045706.n5.nabble.com/file/
合并两个共享 (.so) 库
这个问题在这里已经有了答案: Merge multiple .so shared libraries (2 个答案) 关闭 9 年前。我有我在代码中使用的第三方库的源代码和对象。该库附带有关如何使

首页

博学

6Ren·AI

商城

c - 使用整个 unicode 库的 LZW 压缩