gpt4 book ai didi

java - 从文件、正则表达式中提取与给定模式匹配的段落

转载 作者:太空宇宙 更新时间:2023-11-04 15:24:28 29 4
gpt4 key购买 nike

我有一个巨大的文本文件,其中包含大约 5000 条以下形式的评论:

D123456\tPOS/NEG\n Multiple lines of text go here. \n D654321\tPOS/NEG\n Multiple lines of text go here. \n

...等等。

我需要将它们一一提取。我发现了这个: Best way to extract specific paragraph from file data ,这有一点帮助(使用模式、匹配器)。所以我的正则表达式应该是这样的:

D[0-9]{6}\t(POS|NEG)\n*\n

但这不正确。它应该是什么样子?通过文字:以“D”开头,然后是六个数字,然后是制表符,然后是 POS 或 NEG,然后是新行,然后基本上是任何内容,然后是新行。

最佳答案

这个正则表达式:

(?s)D[0-9]{6}\\t(POS|NEG.*?\n\n

关于java - 从文件、正则表达式中提取与给定模式匹配的段落,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20006961/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com