gpt4 book ai didi

java - Java 从平面文件中读取多条记录

转载 作者:行者123 更新时间:2023-12-01 19:03:22 28 4
gpt4 key购买 nike

我有一个文本文件转储,需要将其转换为分隔文件。该文件包含一系列“记录”(由于缺乏更好的词),格式如下:

User: abc123 
Date: 7/3/12
Subject: the foo is bar
Project: 123456
Problem: foo bar in multiple lines of text
Resolution: foo un-barred in multiple lines of text

User: abc123
Date: 7/3/12
Subject: the foo is bar
Project: 234567
Problem: foo bar in multiple lines of text
Resolution: foo un-barred in multiple lines of text

...

我的最终结果是获得一个包含分隔值的平面文件。使用上面的记录,我们会看到:

abc123;7/3/12;the foo is bar;123456;foo bar in multiple lines of text;foo un-barred in multiple lines of text
abc123;7/3/12;the foo is bar;234567;foo bar in multiple lines of text;foo un-barred in multiple lines of text

代码显示在下面,然后是我遇到的问题。

    import java.util.*;
import java.io.*;
import java.nio.file.*;
//
public class ParseOutlookFolderForSE
{
public static void main(String args[])
{
String user = "";
String PDLDate = "";
String name = "";
String PDLNum = "";
String problemDesc = "test";
String resolutionDesc = "test";
String delim = ";";
int recordCounter = 0;
//
try
{
Path file = Paths.get("testfile2.txt");
FileInputStream fstream = new FileInputStream("testfile2.txt");
// Get the object of DataInputStream
/* DataInputStream in = new DataInputStream(fstream); */
BufferedReader br = new BufferedReader(new InputStreamReader(fstream)); //Buffered Reader
String inputLine = null; //String
StringBuffer theText = new StringBuffer(); //StringBuffer
// problem: output contains last record ONLY. program is cycling through the entire file, overwriting records until the end.
// add a for loop based on recordCounter
for(recordCounter=0;recordCounter<10;recordCounter++)
{
while((inputLine=br.readLine())!=null)
{
if(inputLine.toLowerCase().startsWith("from:"))
{

/* recordCounter = recordCounter++; */ // commented out when I added recordCounter++ to the for loop
user = inputLine.trim().substring(5).trim();
}
else
if(inputLine.toLowerCase().startsWith("effective date"))
{

PDLDate = inputLine.trim().substring(15).trim();
}
else
if(inputLine.toLowerCase().startsWith("to:"))
{

name = inputLine.trim().substring(3).trim();
}
else
if(inputLine.toLowerCase().startsWith("sir number"))
{

PDLNum = inputLine.trim().substring(12).trim();
}
} //close for loop
} // close while
System.out.println(recordCounter + "\n" + user + "\n" + name + "\n" + PDLNum + "\n" + PDLDate + "\n" + problemDesc + "\n" + resolutionDesc);
System.out.println(recordCounter + ";" + user + ";" + name + ";" + PDLNum + ";" + PDLDate + ";" + problemDesc + ";" + resolutionDesc);
String lineForFile = (recordCounter + ";" + user + ";" + name + ";" + PDLNum + ";" + PDLDate + ";" + problemDesc + ";" + resolutionDesc + System.getProperty("line.separator"));
System.out.println(lineForFile);
try
{
BufferedWriter out = new BufferedWriter(new FileWriter("testfileoutput.txt"));
out.write(lineForFile);
out.close();
}
catch (IOException e)
{
System.out.println("Exception ");
}
} //close try
catch (Exception e)
{
System.err.println("Error: " + e.getMessage());
}
}

}

我的最终输出只是最后一条记录。我相信发生的情况是程序正在读取每一行,但只有最后一行不会被下一条记录覆盖。说得通。因此,我添加了一个 FOR 循环,增加 1 if(inputLine.toLowerCase().startsWith("user:")) 并使用我的数据输出计数器变量以验证发生了什么。

我的 FOR 循环在伪代码中的步骤 3 之后开始...在 BufferedReader 之后但在 IF 语句之前。在步骤 6 中写入文件后,我将其终止。我正在使用 for(recCounter=0;recCounter<10;recCounter++),虽然我在输出文件中获得了 10 条记录,但它们都是输入文件的最后一条记录的实例,编号为 0-9。

将 for 循环保留在同一位置,我将其修改为读取 for(recCounter=0;recCounter<10;) 并将 recCounter 的增量放置在 IF 语句内,每次以 User: 开头的行都会递增。在本例中,我的输出文件中还获得了 10 条记录,它们是输入文件中最后一条记录的 10 个实例,并且所有计数器均为 0。

编辑:考虑到文件的格式,从下一个记录确定 w=one 记录的唯一方法是在行开头出现单词“User:”的后续实例。每次发生,直到下一次发生为止,构成一条记录。

似乎我没有正确设置“recCounter”,或者我没有将设置为“开始新记录”的结果解释为“开始新记录”。

有人对如何将此文件作为多条记录读取有任何建议吗?

最佳答案

好的,所以你的伪代码应该是这样的:

declare variables
open file
while not eof
read input
if end of set
format output
write output
clear variables
figure out which variable
store in correct variable
end-while

可能有一个技巧可以确定您何时完成一组并可以开始下一组。如果一个集合应该由一个空行终止,如您的示例所示,那么您可以只检查空行。不然你怎么知道?集合是否总是以“user”开头?

另外,不要忘记写最后一条记录。您不想在缓冲区/表中留下未写的内容。

关于java - Java 从平面文件中读取多条记录,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11316215/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com