gpt4 book ai didi

Java - 使用正则表达式从文档中提取数据

转载 作者:行者123 更新时间:2023-11-30 06:54:29 25 4
gpt4 key购买 nike

我有一个简历数据集,我想从每个简历中提取数据我将举一个例子作为我需要的样本

String test= "Worked in Innovision Information System Private Limited as Project Trainee-Content Writing from Date to Date.";

我想提取公司名称role (designation)Date (From-to)

我是正则表达式的新手,所以如果我错了请纠正我

我首先尝试分别提取它们中的每一个

String regexStr5="Worked in:? \\w+" ;
String regexStr6 ="as:? ([a-zA-Z ]+)";

和日期 Date : (Jan|Feb|Mar|Apr|May|Jun|Jul|Aug|Sep|Oct|Nov|Dec)\d{1,2},\d{4}

如何将它们放在同一个正则表达式中?!!并打印 company-Name +role+date

最佳答案

对于上述测试字符串,文字字符串匹配就可以了。

正则表达式: 在 (.*) 中工作为 (.*) 从 (.*) 到 (.*)。

替换做: 公司名称:\1\n角色(指定):\2\n日期:\3 到\4

Regex101 Demo

关于Java - 使用正则表达式从文档中提取数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36294035/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com