gpt4 book ai didi

java - 通过提取两个字符行之间的行来从文本文件创建文本文件

转载 作者:行者123 更新时间:2023-12-01 12:30:57 38 4
gpt4 key购买 nike

我将读取一个按“##################”分段的语料库,并将每个分段放入一个单独的文本文件中。我的语料库如下:

#####4327(司法系统)

ofobcbyfwquote 右SD A 呃实际上我在欧洲住了几年SD A 我住在德国sd A,在德国他们没有陪审团制度

#####4423(生活权利)

sv B 我认为他们需要做的是他们需要以某种方式lipsmack从中拿走钱sd B 我的意思是当你有一个人签署了一份声明说他有罪时sd B 我们有一个家庭叫整天家庭

我需要其中两个文本文件,分别命名为 4327 和 4423,并在其间包含文本。我知道读取文本文件的标准模型并经常使用它:

        FileInputStream fis = new FileInputStream ("C:\\Users\\Desktop\\Train.txt");
BufferedReader br = new BufferedReader (new InputStreamReader(fis,"UTF-8"));
String line="";
while ((br.readLine().startsWith("#")))
{

但不知道如何命令它从每个段中创建文本文件?

最佳答案

可以使用正则表达式,可以使用ApacheCommon将文件读取到字符串:http://commons.apache.org/proper/commons-io/apidocs/org/apache/commons/io/FileUtils.html#readFileToString(java.io.File) .

代码将是这样的:

File fileToParse = new File("/path/to/file");
String complete = FileUtils.readFiletoString(fileToParse);
String[] fragments = complete.split("\\#+[0-9]+");

也许您需要改进正则表达式并保存每个片段,您也可以使用 FileUtils。

希望对你有帮助。

关于java - 通过提取两个字符行之间的行来从文本文件创建文本文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25924868/

38 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com