java - 使用 TreeMap 的流返回不连贯的结果-6ren

java - 使用 TreeMap 的流返回不连贯的结果

转载作者：行者123 更新时间：2023-12-02 03:06:40

25

4

我正在尝试解决 Cay Horstmann 的“Core Java for the Impressive”中的以下练习:

When an encoder of a Charset with partial Unicode coverage can’t encode a character, it replaces it with a default—usually, but not always, the encoding of "?". Find all replacements of all available character sets that support encoding. Use the newEncoder method to get an encoder, and call its replacement method to get the replacement. For each unique result, report the canonical names of the charsets that use it.

为了教育目的，我决定使用流 API 来处理这个练习，尽管在我看来，更干净的解决方案会将计算分为多个步骤，中间变量为-之间(当然这会简化调试)。话不多说，这是我创建的代码怪物:

   Charset.availableCharsets().values().stream().filter(charset -> charset.canEncode()).collect(
            Collectors.groupingBy(
                    charset -> charset.newEncoder().replacement(),
                    () -> new TreeMap<>((arr1, arr2) -> Arrays.equals(arr1, arr2) == true ? 0 : Integer.compare(arr1.hashCode(), arr2.hashCode())),
                    Collectors.mapping( charset -> charset.name(), Collectors.toList()))).
            values().stream().map(list -> list.stream().collect(Collectors.joining(", "))).forEach(System.out::println);

基本上，我们只考虑canEncode的字符集；创建一个以 replacement 作为键、以规范名称列表作为值的 Map；因为分组对于默认实现 groupingBy(使用 HashMap)的数组不起作用，所以我决定使用 TreeMap。然后，我们使用规范名称的列表，用逗号将它们连接起来并打印。

不幸的是，我发现它给出的结果不连贯。如果我在同一个程序中运行该函数两次，第一个实例将返回由 23 个字符串组成的结果，第二个实例将返回由 21 个字符串组成的结果。我怀疑这与 TreeMap 的 Comparator 实现不佳有关，其定义如下:

((arr1, arr2) -> Arrays.equals(arr1, arr2) == true ? 0 : Integer.compare(arr1.hashCode(), arr2.hashCode()))

如果这是原因，那么在这种情况下，正确的比较器应该是什么？除此之外，单行线还能有什么改进吗？

我也很好奇，像我写的代码这样复杂的结构在专业程序中是否遇到过？也许只有我觉得看不懂？

最佳答案

不保证两个不同实例的哈希码会不同。这将是一个理想的情况，但不能保证。只有相反的情况才是正确的:如果两个对象相等，则它们具有相同的哈希码。

因此，如果您创建一个比较器，当对象具有相同的哈希码时，该比较器将对象视为相同，则任意对象都可能被视为相同。自 byte[] replacement() 返回的数组是防御性副本，读取临时对象，每次运行此代码时结果可能会有所不同。

此外，由于数组的哈希码与其内容无关，因此您的比较器违反了传递性规则:具有相同内容的两个数组应该是相同的，但因为它们可能/很可能具有不同的哈希码，与第三个数组比较时，它们具有不同的关系，不具有相同的内容，a == b ，但是a < c和b > c 。这就是为什么甚至相等的数组的原因，您可以通过 Arrays.equals 进行比较可能最终属于不同的组，如 TreeSet随后与其他 key 进行比较时未能找到现有 key 。

如果你想按值比较数组，可以使用:

Charset.availableCharsets().values().stream().filter(Charset::canEncode).collect(
    Collectors.groupingBy(
            charset -> charset.newEncoder().replacement(),
            () -> new TreeMap<>(Comparator.comparing(ByteBuffer::wrap)),
            Collectors.mapping(Charset::name, Collectors.joining(", "))))
    .values().forEach(System.out::println);

ByteBuffer是 Comparable并一致地评估包装数组的内容。

我移动了Collectors.joining收集器进入grouping避免创建临时收集器List无论如何，您稍后都会加入其内容。

顺便说一句，永远不要使用像 expression == true 这样的代码。没有理由附加 == true如expression已经足够了。

<小时/>

由于您只对值感兴趣，换句话说，不需要键是某种类型，因此您可以预先包装所有数组，简化操作，甚至稍微提高效率:

Charset.availableCharsets().values().stream().filter(Charset::canEncode).collect(
    Collectors.groupingBy(
            charset -> ByteBuffer.wrap(charset.newEncoder().replacement()),
            TreeMap::new,
            Collectors.mapping(Charset::name, Collectors.joining(", "))))
    .values().forEach(System.out::println);

如果不需要一致的迭代顺序，此更改甚至允许诉诸哈希:

Charset.availableCharsets().values().stream().filter(Charset::canEncode).collect(
    Collectors.groupingBy(
            charset -> ByteBuffer.wrap(charset.newEncoder().replacement()),
            Collectors.mapping(Charset::name, Collectors.joining(", "))))
    .values().forEach(System.out::println);

这有效，因为 ByteBuffer还实现 equals和hashCode .

关于java - 使用 TreeMap 的流返回不连贯的结果，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/41631894/

25

4

0

文章推荐： google-maps - 在 Google map 上显示 netCDF 文件

文章推荐： java - 休息通话不工作

java - 流<流> : flatMap vs. 减少
这个问题在这里已经有了答案: Why filter() after flatMap() is "not completely" lazy in Java streams? (8 个答案) 关闭 6
instagram - 是否有像 Twitter 流 API 一样的 Instagram 流 API？
我正在创建一个应用程序来从 Instagram 收集数据。我正在寻找像 Twitter 流 API 这样的流 API，这样我就可以自动实时收集数据而无需发送请求。 Instagram 有类似的 API
java - 您的 InputStream 既不是 OLE2 流，也不是 OOXML 流
我正在使用 Apache Commons 在 Google App Engine 中上传一个 .docx 文件，如此链接中所述 File upload servlet .上传时，我还想使用 Apach
java - 使用 AWS Java DynamoDB 流 Kinesis 适配器处理 DynamoDB 流
我尝试使用 DynamoDB 流和 AWS 提供的 Java DynamoDB 流 Kinesis 适配器捕获 DynamoDB 表更改。我正在 Scala 应用程序中使用 AWS Java 开发工具
FFMPEG RTSP IP 流 (H.264) 转换为 RTSP 流 (MPEG-2)
我目前有一个采用 H.264 编码的 IP 摄像机流式视频 (RTSP)。我想使用 FFmpeg 将此 H.264 编码流转换为另一个 RTSP 流，但 MPEG-2 编码。我该怎么做？我应该使用哪
集群模式下的 Redis 流
Redis 流是否受益于集群模式？假设您有 10 个流，它们是分布在整个集群中还是都分布在同一节点上？我计划使用 Redis 流来实现真正的高吞吐量(200 万条消息/秒)，所以我担心这种规模的 Re
Java 流 - 在可空列表上进行流式处理的优雅方式
这件事困扰了我一段时间。所以我有一个 Product 类，它有一个 Image 列表(该列表可能为空)。我想做 product.getImages().stream().filter(...) 但
具有持久存储的 Redis 流
是否可以使用具有持久存储的 Redis 流还是流仅限于内存数据？我知道可以将 Redis 与核心数据结构的持久存储一起使用，但我已经能够理解是否也可以使用 Redis 中的流的持久存储。最佳答
elixir - 具有前瞻性的可枚举/流
我开始学习 Elixir 并遇到了一个我无法轻松解决的挑战。我正在尝试创建一个函数，该函数接受一个 Enumerable.t 并返回另一个 Enumerable.t ，其中包含下 n 个项目。它与
scala - readLines 流
我试图从 readLine 调用创建一个无限的字符串流: import java.io.{BufferedReader, InputStreamReader} val in = new Buffere
Java 8 流 : For Each
你能帮我使用 Java 8 流 API 编写以下代码吗？ SuperUser superUser = db.getSuperUser; for (final Client client : super
rust - 暗示AsyncRead为补品::流
我正在尝试服用补品routeguide tutorial，并将客户端变成rocket服务器。我只是接受响应并将gRPC转换为字符串。 service RouteGuide { rpc GetF
javascript - 流 - 类型可能与联合类型不兼容
流程代码可以是run here. 使用 flow，我有一个函数，它接受一个键值对对象并获取它的值 - 它获取的值应该是字符串、数字或 bool 值。 type ValueType = string
javascript - 流、对象字面量与联合不兼容
如果我有一个函数返回一个包含数据库信息的对象或一个空对象，如下所示: getThingFromDB: async function(id:string):Promise{ const from
facebook - 流。发布ogg
我正在尝试使用javascript api和FB.ui将ogg音频文件发布到流中，但是我不知道该怎么做。这是我给FB.ui的电话: FB.ui( { method: '
Accurev:无法删除工作区/流
我正在尝试删除工作区(或克隆它以使其看起来像父工作区，但我似乎两者都做不到)。但是，当我尝试时，我收到此消息:无法删除工作区 test_workspace，因为它有一个非空的默认组。据我所知，这意味
java - 流 'map'可以用于这样的处理吗？
可以使用 Stream|Map 来完成此操作，这样我就不需要将结果放入外部 HashMap 中，而是使用 .collect(Collectors.toMap(...)); 收集结果？ Map rep
Java 流 API
当我们从集合列表中获取 Stream 时，幕后到底发生了什么？我发现很多博客都说Stream不存储任何数据。如果这是真的，请考虑代码片段: List list = new ArrayList(); l
带列表的 Java 流
我对流及其工作方式不熟悉，我正在尝试获取列表中添加的特定对象的出现次数。我找到了一种使用Collections来做到这一点的方法。其过程如下: for (int i = 0; i p.conten
Java 流 - 映射列表到简化的映射列表
我希望将一个 map 列表转换为另一个分组的 map 列表。所以我有以下 map 列表 - List [{ "accId":"1", "accName":"TestAcc1", "accNumber

首页

博学

6Ren·AI

商城

java - 使用 TreeMap 的流返回不连贯的结果