从 findWithinHorizon 返回的 Java 大字符串转换为 InputStream-6ren

从 findWithinHorizon 返回的 Java 大字符串转换为 InputStream

转载作者：行者123 更新时间：2023-12-01 04:54:09

25

4

我编写了一个应用程序，该应用程序在其一个模块中解析大文件并将该文件逐 block 保存到数据库中。

首先，以下代码有效，我的主要问题是减少内存使用和总体性能提高。

以下代码片段是大图片的一小部分，但在进行一些 YourKit 分析后是最有问题的，由 /*Here*/ 标记的行分配了大量内存.

....
Scanner fileScanner = new Scanner(file,"UTF-8");
String scannedFarm;
try{

    Pattern p = Pattern.compile("(?:^.++$(?:\\r?+\\n)?+){2,100000}+",Pattern.MULTILINE);
    String [] tableName = null;

/*HERE*/while((scannedFarm = fileScanner.findWithinHorizon(p, 0)) != null){
         boolean continuePrevStream = false;
         Scanner scanner = new Scanner(scannedFarm);

         String[] tmpTableName  = scanner.nextLine().split(getSeparator());
         if (tmpTableName.length==2){
             tableName = tmpTableName;
         }else{
             if (tableName==null){
                 continue;
             }
             continuePrevStream = true;
         }
         scanner.close();

/*HERE*/ InputStream is = new ByteArrayInputStream(scannedFarm.getBytes("UTF-8"));
....

分配大量内存是可以接受的，因为字符串很大(我也需要这么大的 block )，我的主要问题是相同的分配由于 getBytes 发生两次，

所以我的问题是他们有办法将 findWithinHorizon 结果直接传输到 InputStream 而不分配两次内存吗？
他们是实现相同功能的更有效方法吗？

最佳答案

不完全相同的方法，但您可以尝试读取每一行并在行上下文中搜索模式，而不是findWithinHorizon。这肯定会减少内存压力，因为您不会按照 API 的规定缓冲整个文件:

If horizon is 0, then the horizon is ignored and this method continues to search through the input looking for the specified pattern without bound. In this case it may buffer all of the input searching for the pattern.

类似于:

while(String line = fileScanner.nextLine() != null) { 
   if(grep for pattern in line) { 

   }
}

关于从 findWithinHorizon 返回的 Java 大字符串转换为 InputStream，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/14445599/

25

4

0

文章推荐： java - Glassfish 3 : web application deployment doesn't find libraries

文章推荐： jquery - 在 jquery 插件中使用 .on() 的最佳方法？

文章推荐： jaxb - 如何使用 JAXB 以特殊顺序制作@XmlAttribute？

Java InputStream NullPointerException 与 InputStream
我在一个类中有两个方法: private static InputStream getSongStream(String ip, String id){ try { U
java - inputStream 扩展 InputStream 的新类
我创建了一个扩展 InputStream 的新类并且必须 @Override read()。我正在尝试使用方法 read(int b)，但是当我使用它时，它会转到方法read() 和我不能使用参数，我
java - 从 InputStream 解压缩文件并返回另一个 InputStream
我正在尝试编写一个函数，该函数将接受带有压缩文件数据的 InputStream 并返回另一个带有解压缩数据的 InputStream。压缩后的文件将只包含一个文件，因此不需要创建目录等... 我尝试
java - 如何将多个不同的 InputStream 链接到一个 InputStream
我想知道是否有任何理想的方式可以将多个 InputStream 链接到 Java(或 Scala)中的一个连续 InputStream 中。我需要它来解析我从 FTP 服务器通过网络加载的平面文件。
java - 如何防止通过 AutoClose InputStream 关闭 InputStream
我想做的是:打开大文件的 InputStream，按 10MB block 读取它，上传一个 block ，读取下一个 block 。 val chunkCount = Math.ceil(total
java - finally { if (inputStream != null) { inputStream.close();
我不知道怎么理解: { if (inputStream **!= null**) { inputStream.close(); 来自那个例子: public c
java - 如何在不读取 InputStream 的情况下检查 InputStream 是否为空？
我想知道 InputStream 是否为空，但不使用 read() 方法。有没有办法不读取就知道它是否为空？最佳答案不，你不能。 InputStream 设计用于处理远程资源，因此在实际读取它之前
java - 有没有一种方法可以将 InputStream 数据解码为文本，而无需在 InputStream 对象本身上使用流解码器？
我制作了一个蓝牙输入流监听器，只需询问 if(InputStream.isAvailable > 0) 即可检查是否有传入数据，然后创建一个循环将传入数据存储到 int[] 直到没有更多并且它工作完美
java - IOUtils.toByteArray(inputStream) 方法是否在内部关闭 inputStream 对象？
这是我的代码流程，文件内容丢失，我认为可能是 IOUtils.toByteArray() 行有问题，请指导这里实际出了什么问题。文件内容丢失: InputStream stream = someCl
java - 我如何 gzip 一个 InputStream 并返回一个 InputStream？
我从 HTTP 请求的响应开始: InputStream responseInputStream = response.getEntityInputStream() 我需要对该响应进行 gzip 压缩
java - 如何有效地将未压缩的 InputStream 转换为 gzip 压缩的 InputStream？
用户将一个大文件上传到我的网站，我想对该文件进行 gzip 压缩并将其存储在 blob 中。所以我有一个未压缩的 InputStream，而 blob 需要一个 InputStream。我知道如何使用
java - 如何从 GZIP 数据的 InputStream 中获取解压缩数据的 InputStream？
我调用了一个返回压缩文件的服务。我从响应中将数据作为 InputStream(由 javax.activation.DataHandler.getInputStream(); 提供)提供。我想做的是
java - 压缩 InputStream，返回 InputStream(在内存中，没有文件)
我正在尝试压缩一个 InputStream 并返回一个 InputStream: public InputStream compress (InputStream in){ // Read "in
inputstream - 在 Kotlin 中，如何将 InputStream 的全部内容读入字符串？
我最近在 Kotlin 中看到了将 InputStream 的全部内容读入 String 的代码，例如: // input is of type InputStream val baos = Byte
inputstream - 读取 NANOHTTPD 的 InputStream 会出现 Socket TimeOut 异常
我正在尝试使用以下代码从 IHTTPSession.getInputStream() 读取 InputStream，但它每次都给出 Socket TimeOut Exception。 private
java - Jersey InputStream 在过滤器中被修改。无法弄清楚如何访问 Jersey Resource 中修改后的 inputStream
如 How to use Jersey interceptors to get request body 中所述，我正在修改 ContainerRequestFilter 中的 EntityInput
android - inputStream.read() 导致 NullPointerException(检查 inputStream 后!=null)
我正在编写一个需要与蓝牙 2.1 设备交换数据的应用程序。我已经做过好几次了，但这次发生了一些奇怪的事情。 Log.d("TAG", "connectToDevice"); if(ma
java - 使用一个 InputStream 作为多个更高级别 InputStream(如 BufferedReader、DataInputStream)的源
我只是在犹豫这是好主意还是坏主意: InputStreamReader in = new InputStreamReader(socket.getInputStream()); BufferedRea
android - BitmapFactory.decodeStream(InputStream is) 在 Android 上为非 null InputStream 返回 null
我正在开发一个 Android 应用程序，它的 View 包含多个图库。图库的内容(位图)是来自 Internet 的红色。对于第一个画廊，一切正常，但是当尝试下载第二个画廊的第一张图片时，Bitm
inputstream - 最佳做法是将文件读取为InputStream
在Dart中，我想读取BMP，所以可能是BIG文件。我这样做是这样的: var inputStream = imageFile.openInputStream(); inputStream.onDa

首页

博学

6Ren·AI

商城

从 findWithinHorizon 返回的 Java 大字符串转换为 InputStream

首页

博学

6Ren·AI

商城

从 findWithinHorizo​​n 返回的 Java 大字符串转换为 InputStream

从 findWithinHorizon 返回的 Java 大字符串转换为 InputStream