Java多线程编程实战之模拟大量数据同步-6ren

Java多线程编程实战之模拟大量数据同步

转载作者：qq735679552 更新时间：2022-09-28 22:32:09

CFSDN坚持开源创造价值，我们致力于搭建一个资源共享平台，让每一个IT人在这里找到属于你的精彩世界.

这篇CFSDN的博客文章Java多线程编程实战之模拟大量数据同步由作者收集整理，如果你对这篇文章有兴趣，记得点赞哟.

背景。

最近对于 Java 多线程做了一段时间的学习，笔者一直认为，学习东西就是要应用到实际的业务需求中的。否则要么无法深入理解，要么硬生生地套用技术只是达到炫技的效果.

不过笔者仍旧认为自己对于多线程掌握不够熟练，不敢轻易应用到生产代码中。这就按照平时工作中遇到的实际问题，脑补了一个很可能存在的业务场景:

已知某公司管理着 1000 个微信服务号，每个服务号有 1w ~ 50w 粉丝不等。假设该公司每天都需要将所有微信服务号的粉丝数据通过调用微信 API 的方式更新到本地数据库.

需求分析。

对此需求进行分析，主要存在以下问题:

单个服务号获取粉丝 id，只能每次 1w 按顺序拉取
微信的 API 对于服务商的并发请求数量有限制

单个服务号获取粉丝 id，只能每次 1w 按顺序拉取。这个问题决定了单个公众号在拉取粉丝 id 上，无法分配给多个线程执行.

微信的 API 对于服务商的并发请求数量有限制。这点最容易被忽略，如果我们同时有过多的请求，则会导致接口被封禁。这里可以通过信号量来控制同时执行的线程数量.

为了尽快完成数据同步，根据实际情况：整个数据同步可分为读数据和写数据两个部分。读数据是通过 API 获取，走网络 IO，速度较慢；写数据是写到数据库，速度较快。所以得出结论：需要分配较多的线程进行读数据，较少的线程进行写数据.

设计要点。

首先，我们需要确定开启多少个线程（在生产中往往是使用线程池），线程数量需要根据服务器性能来决定，这里我们定为 40 个读取数据线程（将 1000 个公众号分为 40 份，分别在 40 个线程中执行），1个写入数据线程。（具体开多少个线程，取决于线程池的容量，以及可以分配给此业务的数量。具体的数字需要根据实际情况测试得出，比服务器阈值低一些较好。当然，配置允许范围内越大越好）。

其次，考虑到微信对于 API 并发请求的限制，需要限制同时执行的线程数，使用java.util.concurrent.Semaphore进行控制，这里我们限制为 20 个（具体的信号量凭证数，取决于同一时间能够执行的线程，跟 API 限制，服务器性能有关）.

然后，我们需要知道数据何时读取、写入完毕，以控制程序逻辑以及终止程序，这里我们使用java.util.concurrent.CountDownLatch进行控制.

最后，我们需要一个数据结构，用来在多个线程中共享处理的数据，此处同步数据的场景非常适合使用队列，这里我们使用线程安全的java.util.concurrent.ConcurrentLinkedQueue来进行处理。（需要注意的是，在实际开发中，队列不能够无限制地增长，这将会很快消耗掉内存，我们需要根据实际情况对队列长度做控制。例如，可以通过控制读取线程数和写入线程数的比例来控制队列的长度）。

模拟代码。

由于本文重点关注多线程的使用，模拟代码只体现多线程操作的方法。代码里添加了大量的注释，方便各位读者阅读理解.

JDK：1.8 。

 
    ? 
   
         import 
         java.util.Arrays; 
        
         import 
         java.util.List; 
        
         import 
         java.util.Queue; 
        
         import 
         java.util.concurrent.ConcurrentLinkedQueue; 
        
         import 
         java.util.concurrent.CountDownLatch; 
        
         import 
         java.util.concurrent.Semaphore; 
        
         import 
         java.util.concurrent.TimeUnit; 
        
         /** 
        
         * N个线程向队列添加数据 
        
         * 一个线程消费队列数据 
        
         */ 
        
         public 
         class 
         QueueTest { 
        
         private 
         static 
         List<String> data = Arrays.asList( 
         "a" 
         ,  
         "b" 
         ,  
         "c" 
         ,  
         "d" 
         ,  
         "e" 
         ); 
        
         private 
         static 
         final 
         int 
         OFFER_COUNT =  
         40 
         ;  
         // 开启的线程数量 
        
         private 
         static 
         Semaphore semaphore =  
         new 
         Semaphore( 
         20 
         );  
         // 同一时间执行的线程数量（大多用于控制API调用次数或数据库查询连接数） 
        
         public 
         static 
         void 
         main(String[] args)  
         throws 
         InterruptedException { 
        
         Queue<String> queue =  
         new 
         ConcurrentLinkedQueue<>();  
         // 处理队列，需要处理的数据，放置到此队列中 
        
         CountDownLatch offerLatch =  
         new 
         CountDownLatch(OFFER_COUNT);  
         // offer线程latch，每完成一个，latch减一，lacth的count为0时表示offer处理完毕 
        
         CountDownLatch pollLatch =  
         new 
         CountDownLatch( 
         1 
         );  
         // poll线程latch，latch的count为0时，表示poll处理完毕 
        
         Runnable offerRunnable = () -> { 
        
         try 
         { 
        
         semaphore.acquire();  
         // 信号量控制 
        
         }  
         catch 
         (InterruptedException e) { 
        
         e.printStackTrace(); 
        
         } 
        
         try 
         { 
        
         for 
         (String datum : data) { 
        
         queue.offer(datum); 
        
         TimeUnit.SECONDS.sleep( 
         2 
         );  
         // 模拟取数据很慢的情况 
        
         } 
        
         }  
         catch 
         (InterruptedException e) { 
        
         e.printStackTrace(); 
        
         }  
         finally 
         { 
        
         // 在finally中执行latch.countDown()以及信号量释放，避免因异常导致没有正常释放 
        
         offerLatch.countDown(); 
        
         semaphore.release(); 
        
         } 
        
         }; 
        
         Runnable pollRunnable = () -> { 
        
         int 
         count =  
         0 
         ; 
        
         try 
         { 
        
         while 
         (offerLatch.getCount() >  
         0 
         || queue.size() >  
         0 
         ) {  
         // 只要offer的latch未执行完，或queue仍旧有数据，则继续循环 
        
         String poll = queue.poll(); 
        
         if 
         (poll !=  
         null 
         ) { 
        
         System.out.println(poll); 
        
         count++; 
        
         } 
        
         // 无论是否poll到数据，均暂停一小段时间，可降低CPU消耗 
        
         TimeUnit.MILLISECONDS.sleep( 
         100 
         ); 
        
         } 
        
         System.out.println( 
         "total count:" 
         + count); 
        
         }  
         catch 
         (InterruptedException e) { 
        
         e.printStackTrace(); 
        
         }  
         finally 
         { 
        
         // 在finally中执行latch.countDown()，避免因异常导致没有正常释放 
        
         pollLatch.countDown(); 
        
         } 
        
         }; 
        
         // 启动线程（生产环境中建议使用线程池） 
        
         new 
         Thread(pollRunnable).start();  
         // 启动一个poll线程 
        
         for 
         ( 
         int 
         i =  
         0 
         ; i < OFFER_COUNT; i++) { 
        
         new 
         Thread(offerRunnable).start(); 
        
         }  
         // 模拟取数据很慢，需要开启40个线程处理 
        
         // latch等待，会block主线程直到latch的count为0 
        
         offerLatch.await(); 
        
         pollLatch.await(); 
        
         System.out.println( 
         "===the end===" 
         ); 
        
         } 
        
         }

到这里，本文结束。以上是笔者脑补的一个常见需求的解决方案.

注意：多线程编程对实际环境和需求有很大的依赖，需要根据实际的需求情况对各个参数做调整。实际在使用中，需要尽量模拟生产环境的数据情况来进行测试，对服务器执行期间的并发数，CPU、内存、网络 IO、磁盘 IO 做好观察。并适当地调低并发数，以给服务器留有处理其他请求的余量.

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持我.

原文链接：https://segmentfault.com/a/1190000018145133 。

最后此篇关于Java多线程编程实战之模拟大量数据同步的文章就讲到这里了,如果你想了解更多关于Java多线程编程实战之模拟大量数据同步的内容请搜索CFSDN的文章或继续浏览相关文章，希望大家以后支持我的博客！。

文章推荐： Java Spring-IOC容器与Bean管理之基于注解的方式案例详解

文章推荐： RocketMQ4.5.2 修改mqnamesrv 和 mqbroker的日志路径操作

文章推荐：掌握这七条准则，提升用户登录成功率！

文章推荐：因不会远程debug调试我被项目经理嘲笑了

java - Java 方法如何检索属于该特定方法的方法对象？ ( java )
我正在编写一个具有以下签名的 Java 方法。 void Logger(Method method, Object[] args); 如果一个方法(例如 ABC() )调用此方法 Logger，它应该
java - (Java) Java 找不到我的图像文件
我是 Java 新手。我的问题是我的 Java 程序找不到我试图用作的图像文件一个 JButton。 (目前这段代码什么也没做，因为我只是得到了想要的外观第一的)。这是我的主课代码: packag
java - java Java 有手动垃圾回收吗？
好的，今天我在接受采访，我已经编写 Java 代码多年了。采访中说“Java 垃圾收集是一个棘手的问题，我有几个 friend 一直在努力弄清楚。你在这方面做得怎么样？”。她是想骗我吗？还是我的一生都
java - Java 之谜 - Java
我的 friend 给了我一个谜语让我解开。它是这样的: There are 100 people. Each one of them, in his turn, does the following
java - Java 字节码是否兼容不同版本的 Java？
如果我将使用 Java 5 代码的应用程序编译成字节码，生成的 .class 文件是否能够在 Java 1.4 下运行？如果后者可以工作并且我正在尝试在我的 Java 1.4 应用程序中使用 Jav
java - Java 缺少无符号原始类型是 Java 平台的特征还是 Java 语言的特征？
有关于why Java doesn't support unsigned types的问题以及一些关于处理无符号类型的问题。我做了一些搜索，似乎 Scala 也不支持无符号数据类型。限制是Java和S
java - Java 7 的 Java 字节码可以在其他版本的 Java 中工作吗
我只是想知道在一个 java 版本中生成的字节码是否可以在其他 java 版本上运行最佳答案通常，字节码无需修改即可在较新版本的 Java 上运行。它不会在旧版本上运行，除非您使用特殊参数 (
java -cp 。 test.java 与 java test.java
我有一个关于在命令提示符下执行 java 程序的基本问题。在某些机器上我们需要指定 -cp 。 (类路径)同时执行java程序 (test为java文件名与.class文件存在于同一目录下) jav
java - 使用 Java (Java EE/Java SE) 的数据库应用程序设计模式
我已经阅读 StackOverflow 有一段时间了，现在我才鼓起勇气提出问题。我今年 20 岁，目前在我的家乡(罗马尼亚克卢日-纳波卡)就读 IT 大学。足以介绍:D。基本上，我有一家提供簿记应用
java - Java 中的解析可在 Java 中访问
我有 public JSONObject parseXML(String xml) { JSONObject jsonObject = XML.toJSONObject(xml); r
java - Java 中的解释性语言以及对 Java 方法的调用
我已经在 Java 中实现了带有动态类型的简单解释语言。不幸的是我遇到了以下问题。测试时如下代码: def main() { def ks = Map[[1, 2]].keySet()
java - java 序数 - Java I 类
一直提示输入 1 到 10 的数字 - 结果应将 st、rd、th 和 nd 添加到数字中。编写一个程序，提示用户输入 1 到 10 之间的任意整数，然后以序数形式显示该整数并附加后缀。 public
java - 如何从 Java 执行 Java？
我有这个 DownloadFile.java 并按预期下载该文件: import java.io.*; import java.net.URL; public class DownloadFile {
java - 延迟不适用于 java gui(java)
我想在 GUI 上添加延迟。我放置了 2 个 for 循环，然后重新绘制了一个标签，但这 2 个 for 循环一个接一个地执行，并且标签被重新绘制到最后一个。我能做什么？ for(int i=0;
java - Java 类中的硬编码 Java 列表
我正在对对象 Student 的列表项进行一些测试，但是我更喜欢在 java 类对象中创建硬编码列表，然后从那里提取数据，而不是连接到数据库并在结果集中选择记录。然而，自从我这样做以来已经很长时间了，
java - java 幕后对象创建(java 对象实例化)
我知道对象创建分为三个部分: 声明实例化初始化 classA{} classB extends classA{} classA obj = new classB(1,1); 实例化它必须使用
java - 车辆跟踪系统[java/Java EE]
我有兴趣使用 GPRS 构建车辆跟踪系统。但是，我有一些问题要问以前做过此操作的人: GPRS 是最好的技术吗？人们意识到任何问题吗？我计划使用 Java/Java EE - 有更好的技术吗？如果
java - 逆数组(Java)//逆数组(Java)
我可以通过递归方法反转数组，例如:数组={1,2,3,4,5} 数组结果={5,4,3,2,1}但我的结果是相同的数组，我不知道为什么，请帮助我。 public class Recursion { p
java - Java/Java EE 的构建和集成环境
有这样的标准方式吗？包括 Java源代码-测试代码- Ant 或 Maven联合单元持续集成(可能是巡航控制)ClearCase 版本控制工具部署到应用服务器最后我希望有一个自动构建和集成环境。
java - 我将如何从 java 程序打印文本？ ( java )
我什至不知道这是否可能，我非常怀疑它是否可能，但如果可以，您能告诉我怎么做吗？我只是想知道如何从打印机打印一些文本。有什么想法吗？最佳答案这里有更简单的事情。 import javax.swin

qq735679552

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

Java多线程编程实战之模拟大量数据同步