gpt4 book ai didi

java - 使用JAVA方法读取大文本文件

转载 作者:行者123 更新时间:2023-12-01 17:59:17 25 4
gpt4 key购买 nike

您好,我在读取文件时遇到问题。

我有很大的 .txt 文件 (500MB)

我想用方法读取行,我启动方法 medhor rsault 是第一行。我启动第二个方法并返回第二行

我有这个代码。我保存最后读取的行并读取行+1,但程序在每行<最后读取的行处停止。如果我读到 100 000< 行,那就太长了。

public  static Boolean Jedno(){
int poradievtahu=0;
int[] tah=new int[7];
String subor= "C:/Users/Paradox/workspace/Citaj_po_Riadku/all6.txt";
Scanner sc;
try {
sc = new Scanner(new File(subor));
int lineIndex = 0;
cit: while(sc.hasNextLine()) {
String line = sc.nextLine();
if(lineIndex++ >= pocetC+1) {
System.out.print("Zvacsujem "+ (pocetC+1) + " " + line);
// do something
poradievtahu=-1;
Scanner scanner=new Scanner(line);
while(scanner.hasNextInt()){
int pom= scanner.nextInt();

tah[++poradievtahu]=pom;
if (poradievtahu==5){
poradievtahu=-1;
pocetC++;

if ((pocetC%(55935)==0)&&(pocetC!=0)){
Calendar cal = Calendar.getInstance();
PrintWriter writer4 = new PrintWriter(new BufferedWriter(new FileWriter("nove.txt", true)));
SimpleDateFormat sdf = new SimpleDateFormat("HH:mm:ss");
writer4.println("Ďalšia 1/1470 in " + sdf.format(cal.getTime()));
writer4.println(Arrays.toString(tah));
writer4.close();
}
if (pocetC>=13983816){
//berem=false;
PrintWriter writer4 = new PrintWriter(new BufferedWriter(new FileWriter("mozne.txt", true)));
Calendar cal = Calendar.getInstance();
SimpleDateFormat sdf = new SimpleDateFormat("HH:mm:ss");
writer4.println("End file in " + sdf.format(cal.getTime()));
writer4.close();

return true;
}

Pocty.hladam=tah;
}
}
break cit;
}
}
} catch (FileNotFoundException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
return false;
}

请问你有一些IDE如何解决问题吗?但如果我设置第 500 000 行,就会超过 1 秒。但文件有 19 000 000 行..

最佳答案

我不确定我是否明白你的想法,但如果你想处理文件中从 X 行到 Y 行的某些行,我建议使用 File.lines() 方法:

public static void processLinesFromPoint(int startLine, int numberOfLinesToProcess) throws IOException {
//assume startLine = 5000
// numberOfLinesToProcess = 500
Stream<String> lines = Files.lines(Paths.get(pathToYourFile)).skip(startLine).limit(numberOfLinesToProcess);
//lines.forEach method to loop through lines 5000 to 5500 (startLine+numberOfLinesToProcess)
//and printing each line
lines.forEach(currentLine->{
//here goes your logic to process each line...
System.out.println(currentLine)
});
}

Files.lines 具有函数,因此您可以获得所需的行数,并使用 Files.lines().count() 获取文件中的总行数。

P.S:我使用此方法处理超过2Gb的文件,希望答案有用)

关于java - 使用JAVA方法读取大文本文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42275602/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com