- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
考虑以下字符串:
Arg = "north_carolina_state_university"
Text = "哈克尼在转到北卡罗来纳大学教堂山分校之前就读于北卡罗来纳州立大学,在那里他获得了学士和法学博士学位。他在 1971-74 年间担任检察官,然后开始私有(private)执业。1974 年,他是众议员艾克·安德鲁斯的竞选经理。在北卡罗来纳大学教堂山分校读本科期间,他撰写了关于北卡罗来纳州惩教系统历史的荣誉论文。”
我知道可以在文本中找到 Arg 的变体,但不一定相同,而且 Arg 可能有噪音。
另一个例子如下:
Arg2 = "maurice_blackburn"
Text2 = "Maurice McCrae Blackburn(1880 年 11 月 19 日 - 1944 年 3 月 31 日),澳大利亚政治家和律师,出生于维多利亚州英格伍德。1887 年父亲去世后,他随母亲移居墨尔本。 1896 年毕业于墨尔本文法学校。完成学业后,他进入墨尔本大学,1909 年毕业于艺术和法律专业,一年后开始从事律师工作。”
在上面的示例中,Arg2 中的中间名未在 Text2 中使用。
Arg3 = "kansas_city_metropolitan_area"Text3 = "罗奇被选为共和党人参加了第六十七届和第六十八届国会(1921年3月4日-1925年3月3日)。他担任司法部支出委员会主席(第六十八届国会). 他在 1924 年竞选连任第六十九届国会时落选。他于 1924 年 12 月 27 日移居密苏里州圣路易斯,并恢复从事法律工作。他于 6 月 29 日在密苏里州堪萨斯城去世, 1934 年,他被安葬在密苏里州罗奇附近的罗奇公墓。
在此示例中,“堪萨斯城”出现在 Text3 中,但没有“大都会区”(因为它出现在 Arg3 中)。
有没有发现文本中出现 Arg 的函数/库?
最佳答案
我希望这个答案至少可以帮助您获得一些想法。我创建了一个方法来回答这个问题
Any function/library to discover the occurrence of the Arg in the text?
这是我使用上面的示例从我的方法中收到的以下输出:
Arg = "north_carolina_state_university"
Text = "Hackney attended North Carolina State University before transferring to the University of North Carolina at Chapel Hill, where he earned bachelor's and Juris Doctor degrees. He worked as a prosecutor from 1971-74 before going into private practice. In 1974, he was campaign manager for Congressman Ike Andrews. While an undergraduate at UNC-Chapel Hill, he wrote his Honors Thesis on the history of the North Carolina corrections system."
Output
Match Results
Words:4/4
Letters:28/28
Arg2 = "maurice_blackburn"
Text2 = "Maurice McCrae Blackburn (19 November 1880 -- 31 March 1944), Australian politician and lawyer, was born in Inglewood, Victoria. He moved to Melbourne with his mother following the death of his father in 1887. He was educated at Melbourne Grammar School matriculating in 1896. After completing school, he attended the University of Melbourne, graduating in arts and law in 1909, and began to practice as a lawyer a year later."
Output
Match Results
Words:2/2
Letters:16/16
Arg3 = "kansas_city_metropolitan_area"
Text3 = "Roach was elected as a Republican to the Sixty-seventh and Sixty-eighth Congresses (March 4, 1921-March 3, 1925). He served as chairman of the Committee on Expenditures in the Department of Justice (Sixty-eighth Congress). He was an unsuccessful candidate for reelection in 1924 to the Sixty-ninth Congress. He moved to St. Louis, Missouri, December 27, 1924, and resumed the practice of law. He died at Kansas City, Missouri, June 29, 1934. He was interred in Roach Cemetery near Roach, Missouri".
Output
Match Results
Words:2/4
Letters:13/26
该方法只搜索英文字母表,只搜索单词(空格分隔),也不搜索乱序的单词字母。如果您搜索 cat 并且有人键入 acat,它将显示为不匹配,也不会显示为任何字母匹配。这是有意的,因为狗不是热狗。你真的必须决定你希望你的比赛有多模糊。这段代码绝不是最好的,但我希望它能给你一些想法,也许可以重写它,使其更加整洁有序。无论哪种方式,它都会回答您提出的确切问题。
public static String search(String search, String target) {
String result = "";
search = search.toLowerCase();
target = target.toLowerCase();
StringBuilder temp = new StringBuilder();
ArrayList<String> searchWords = new ArrayList<String>();
ArrayList<String> targetWords = new ArrayList<String>();
char lastChar = ' ';
char currentChar = ' ';
// search,text
int swords, twords, sletters, tletters, mwords, mletters;
swords = twords = sletters = tletters = mwords = mletters = 0;
for (Character c : search.toCharArray()) {
currentChar = c > 96 && c < 123 ? c : ' ';
if (lastChar == ' ' && currentChar == ' ')
continue;
if (currentChar != ' ' && ++sletters != 0)
temp.append(currentChar);
else {
searchWords.add(temp.toString());
temp.setLength(0);
}
lastChar = currentChar;
}
searchWords.add(temp.toString());
temp.setLength(0);
lastChar = ' ';
for (Character c : target.toCharArray()) {
currentChar = c > 96 && c < 123 ? c : ' ';
if (lastChar == ' ' && currentChar == ' ')
continue;
if (currentChar != ' ' && ++tletters != 0)
temp.append(currentChar);
else {
targetWords.add(temp.toString());
temp.setLength(0);
}
lastChar = currentChar;
}
targetWords.add(temp.toString());
temp.setLength(0);
search = searchWords.toString();
target = targetWords.toString();
swords = searchWords.size();
twords = targetWords.size();
int[] blm = new int[searchWords.size()]; // best letter match
int lm = 0;// letter match
for (int i = 0; i < searchWords.size(); i++) {
for (String t : targetWords) {
for (int i2 = 0; i2 < (searchWords.get(i).length() < t
.length() ? searchWords.get(i).length() : t
.length()); i2++) {
if (t.charAt(i2) == searchWords.get(i).charAt(i2))
lm++;
}
if (blm[i] < lm)
blm[i] = lm;
lm = 0;
}
}
for (int i = 0; i < blm.length; i++) {
if (blm[i] == searchWords.get(i).length())
mwords++;
mletters += blm[i];
}
result = MessageFormat
.format("-----\nSearch text:\"{0}\"\nWords:{1}\nLetters:{2}\n-----\nTarget text:\"{3}\"\nWords:{4}\nLetters:{5}\n-----\nMatch Results\nWords:{6}/{1}\nLetters:{7}/{2}",
search, swords, sletters, target, twords, tletters,
mwords, mletters);
return result;
}
关于java - Java 中的嘈杂字符串匹配?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23095751/
我正在编写一个具有以下签名的 Java 方法。 void Logger(Method method, Object[] args); 如果一个方法(例如 ABC() )调用此方法 Logger,它应该
我是 Java 新手。 我的问题是我的 Java 程序找不到我试图用作的图像文件一个 JButton。 (目前这段代码什么也没做,因为我只是得到了想要的外观第一的)。这是我的主课 代码: packag
好的,今天我在接受采访,我已经编写 Java 代码多年了。采访中说“Java 垃圾收集是一个棘手的问题,我有几个 friend 一直在努力弄清楚。你在这方面做得怎么样?”。她是想骗我吗?还是我的一生都
我的 friend 给了我一个谜语让我解开。它是这样的: There are 100 people. Each one of them, in his turn, does the following
如果我将使用 Java 5 代码的应用程序编译成字节码,生成的 .class 文件是否能够在 Java 1.4 下运行? 如果后者可以工作并且我正在尝试在我的 Java 1.4 应用程序中使用 Jav
有关于why Java doesn't support unsigned types的问题以及一些关于处理无符号类型的问题。我做了一些搜索,似乎 Scala 也不支持无符号数据类型。限制是Java和S
我只是想知道在一个 java 版本中生成的字节码是否可以在其他 java 版本上运行 最佳答案 通常,字节码无需修改即可在 较新 版本的 Java 上运行。它不会在旧版本上运行,除非您使用特殊参数 (
我有一个关于在命令提示符下执行 java 程序的基本问题。 在某些机器上我们需要指定 -cp 。 (类路径)同时执行java程序 (test为java文件名与.class文件存在于同一目录下) jav
我已经阅读 StackOverflow 有一段时间了,现在我才鼓起勇气提出问题。我今年 20 岁,目前在我的家乡(罗马尼亚克卢日-纳波卡)就读 IT 大学。足以介绍:D。 基本上,我有一家提供簿记应用
我有 public JSONObject parseXML(String xml) { JSONObject jsonObject = XML.toJSONObject(xml); r
我已经在 Java 中实现了带有动态类型的简单解释语言。不幸的是我遇到了以下问题。测试时如下代码: def main() { def ks = Map[[1, 2]].keySet()
一直提示输入 1 到 10 的数字 - 结果应将 st、rd、th 和 nd 添加到数字中。编写一个程序,提示用户输入 1 到 10 之间的任意整数,然后以序数形式显示该整数并附加后缀。 public
我有这个 DownloadFile.java 并按预期下载该文件: import java.io.*; import java.net.URL; public class DownloadFile {
我想在 GUI 上添加延迟。我放置了 2 个 for 循环,然后重新绘制了一个标签,但这 2 个 for 循环一个接一个地执行,并且标签被重新绘制到最后一个。 我能做什么? for(int i=0;
我正在对对象 Student 的列表项进行一些测试,但是我更喜欢在 java 类对象中创建硬编码列表,然后从那里提取数据,而不是连接到数据库并在结果集中选择记录。然而,自从我这样做以来已经很长时间了,
我知道对象创建分为三个部分: 声明 实例化 初始化 classA{} classB extends classA{} classA obj = new classB(1,1); 实例化 它必须使用
我有兴趣使用 GPRS 构建车辆跟踪系统。但是,我有一些问题要问以前做过此操作的人: GPRS 是最好的技术吗?人们意识到任何问题吗? 我计划使用 Java/Java EE - 有更好的技术吗? 如果
我可以通过递归方法反转数组,例如:数组={1,2,3,4,5} 数组结果={5,4,3,2,1}但我的结果是相同的数组,我不知道为什么,请帮助我。 public class Recursion { p
有这样的标准方式吗? 包括 Java源代码-测试代码- Ant 或 Maven联合单元持续集成(可能是巡航控制)ClearCase 版本控制工具部署到应用服务器 最后我希望有一个自动构建和集成环境。
我什至不知道这是否可能,我非常怀疑它是否可能,但如果可以,您能告诉我怎么做吗?我只是想知道如何从打印机打印一些文本。 有什么想法吗? 最佳答案 这里有更简单的事情。 import javax.swin
我是一名优秀的程序员,十分优秀!