- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我需要检查文本中的拼写和语法,所以我开始使用 LanguageTool API ( Can be found here )。现在,当我编写他们提供的启动代码时,如下所示-
JLanguageTool langTool = new JLanguageTool(Language.ENGLISH);
langTool.activateDefaultPatternRules();
List<RuleMatch> matches = langTool.check("Eat I rice" +
"every day and go school to good as a boy");
for (RuleMatch match : matches) {
System.out.println("Potential error at line " +
match.getEndLine() + ", column " +
match.getColumn() + ": " + match.getMessage());
System.out.println("Suggested correction: " +
match.getSuggestedReplacements());
}
我没有收到任何错误。对不起,如果我错了,但是句子“每天吃米饭然后像男孩一样上学”是正确的句子(语法上)吗?如果是,或者如果不是,那么是否有任何方法可以使用该工具检测此类句子(无意义和/或语法错误)?
最佳答案
语言工具是基于规则的。显然,“每天吃米饭,好好上学”这句话还没有被任何规则捕获。
http://wiki.languagetool.org/tips-and-tricks包含有关如何将用户定义的规则添加到 Languagetool 的信息。
这是一个这样的规则的例子:
<rule>
<pattern>
<token>
<exception regexp="yes">(that|ha[ds]|will|must|could|can|should|would|does|did|may|might|t|let)</exception>
<exception inflected="yes" regexp="yes">feel|hear|see|watch|prevent|help|stop|be</exception>
<exception postag="C[CD]|IN|DT|MD|NNP|\." postag_regexp="yes"></exception>
<exception scope="previous" postag="PRP$"/>
</token>
<token postag="NNP" regexp="yes">.{2,}<exception postag="JJ|CC|RP|DT|PRP\$?|NNPS|NNS|IN|RB|WRB|VBN" postag_regexp="yes"></exception></token>
<marker>
<token postag="VB|VBP" postag_regexp="yes" regexp="yes">\p{Lower}+<exception postag="VBN|VBD|JJ|IN|MD" postag_regexp="yes"></exception></token>
</marker>
<token postag="IN|DT" postag_regexp="yes"></token>
</pattern>
<message>The proper name in singular (<match no="2"></match>) must be used with a third-person verb: <suggestion><match no="3" postag="VBZ"></match></suggestion>.</message>
<short>Grammatical problem</short>
<example correction="walks" type="incorrect">Ann <marker>walk</marker> to the building.</example>
<example type="correct">Bill <marker>walks</marker> to the building.</example>
<example type="correct">Guinness <marker>walked</marker> to the building.</example>
<example type="correct">Roosevelt and Hoover speak each other's lines.</example>
<example type="correct">Boys are at higher risk for autism than girls.</example>
<example type="correct">In reply, he said he was too old for this.</example>
<example type="correct">I can see Bill looking through the window.</example>
<example type="correct">Richard J. Hughes made his Morris County debut in his bid for the Democratic gubernatorial elections.</example>
<example type="correct">... last night got its seven-concert Beethoven cycle at Carnegie Hall off to a good start.</example>
<example type="correct">... and through knowing Him better to become happier and more effective people.</example>
<!-- TODO: Fix false-positive: The library and Medical Center are to the north.-->
<!-- The present Federal program of vocational education began in 1917. -->
</rule>
有一个在线规则编辑器可用在
http://community.languagetool.org/ruleEditor2/
一个简单的解决方案是
<!-- English rule, 2014-09-19 -->
<rule id="ID" name="EatI">
<pattern> <token>Eat</token> <token>i</token> </pattern>
<message>Instead of <match no="2"/> <match no="1"/> it should be <match no="1"/> <match no="2"/></message>
<url>http://stackoverflow.com/questions/13016469/detecting-meaningless-and-or-grammatically-incorrect-sentence-with-languagetool/25933907#25933907</url>
<short>wrong order of verb and nown</short>
<example type='incorrect'><marker>Eat i</marker> rice</example> <example type='correct'>I eat rice</example>
</rule>
但当然这只会涵盖动词“吃”——但我希望你明白它是如何工作的……
关于java - 使用 LanguageTool 检测无意义和/或语法错误的句子,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13016469/
我有一张 table People (First_Name, Last_Name)。此表包含与示例中一样重复的记录(并非所有行都重复): First_Name Last_Name John
我用 Java 编写过很多程序,之前也涉足过 C++。我在各种 C++ 书籍中阅读了有关指针的内容,并完成了书籍中的各种示例。 我了解指针的基础知识,但有一件事我一直不清楚。指针在现实世界中的应用是什
线 .Mappings(m => m.FluentMappings.AddFromAssemblyOf() 它有什么作用?它会在派生自 ClassMap 的 Product 类的程序集中查找任
我有用于打印数字的自定义打印功能。我制作了一个 ASCII 版本和一个 UTF-16LE 版本。 UTF-16LE 版本对 0-9 使用全角代码/字符,对十六进制使用 A-F。在调试我的函数时,我注意
这是我的代码片段: float ab(float); 以后 if(ab(temp)
我在一个项目文件中包含以下代码: //begin of the file ((window) => { 'use strict'; class View extends GSM.Event
我一直在到处寻找关于 ? 用法的正确解释。和 *。我注意到我可以使用以下方法拒绝所有用户的访问: 如果我想允许某个组,我应该在其上方添加下一行: 但是当我看到人们使用 ? 时,我开始忘记什么意思,
我正在关注 melon js tutorial .这是在我的 HUD.js 文件的顶部。 game.HUD = game.HUD || {} 我以前在其他例子中见过这个。 namespace.some
我正在处理一个包含数千行代码的文件。我正在第 700 行实现一个算法。我经常不得不离开这些行来检查文件中的其他方法。 导航回到我实际编码的地方通常很痛苦。如果我可以在第 700 行设置一个航路点并为其
我遇到了这段代码 do { if (higherQuality && w > targetWidth) { w /= 2; if (w &
uint8_t * const LCDMem = (uint8_t *) &LCDM3; 此代码在 msp430fg4618 培训套件中用于 lcd 配置。谁能解释一下上述代码的含义? 它允许使用 a
上下文 阅读一些内核代码。 问题 我不明白这行是什么意思 *(void **) &(int[2]){0,PAGE_SIZE}; 还有更多,这是什么意思 {0,PAGE_SIZE} 对我来说,它看起来不
我正在查看 Underscore.js 的源代码库,专门用于 map方法(该页面第 85 行左右,并复制到此处): _.map = function(obj, iterator, context)
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visit the help center . 关闭 9
我是一名优秀的程序员,十分优秀!