- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在做“网络视频分类”的最后一年项目,其中一部分是查找特定单词的相似(同义词)单词,我想从中删除相似的术语。
我懂Java语言,所以我选择了“Java的单词相似度”ws4j
为此我只使用了 WS4J1.0.1 jar 文件,即使我没有下载任何额外的文件,例如 WordNet 词法数据库或 sqlite 数据库来存储它。因为在该网站中他们提到所有内容都包含在这个 jar 文件中预编译的。
当我执行Demo程序时SimilarityCalculationDemo.java ,我收到以下错误:
java.sql.BatchUpdateException: batch entry 0: [SQLITE_CORRUPT] The database disk image is malformed (database disk image is malformed)
at org.sqlite.Stmt.executeBatch(Stmt.java:226)
at org.sqlite.Stmt.executeBatch(Stmt.java:226)
at edu.cmu.lti.jawjaw.db.SQL.createIndexIfNotExists(SQL.java:118)
at edu.cmu.lti.jawjaw.db.SQL.createSQLConnection(SQL.java:98)
at edu.cmu.lti.jawjaw.db.SQL.<init>(SQL.java:55)
at edu.cmu.lti.jawjaw.db.SQL.<clinit>(SQL.java:45)
at edu.cmu.lti.jawjaw.db.WordDAO.findWordsByLemmaAndPos(WordDAO.java:124)
at edu.cmu.lti.jawjaw.util.WordNetUtil.wordToSynsets(WordNetUtil.java:38)
at edu.cmu.lti.lexical_db.NictWordNet.getAllConcepts(NictWordNet.java:38)
atedu.cmu.lti.ws4j.util.WordSimilarityCalculator.calcRelatednessOfWords(WordSimilarityCalculator.java:79)
at edu.cmu.lti.ws4j.RelatednessCalculator.calcRelatednessOfWords(RelatednessCalculator.java:61)
at web_cat.SimilarityCalculationDemo.run(SimilarityCalculationDemo.java:37)
at web_cat.SimilarityCalculationDemo.main(SimilarityCalculationDemo.java:43)
java.sql.SQLException: [SQLITE_CORRUPT] The database disk image is malformed (database disk image is malformed)
at org.sqlite.DB.newSQLException(DB.java:383)
at org.sqlite.DB.newSQLException(DB.java:387)
at org.sqlite.DB.throwex(DB.java:374)
at org.sqlite.NativeDB.prepare(Native Method)
at org.sqlite.DB.prepare(DB.java:123)
at org.sqlite.Stmt.execute(Stmt.java:113)
at edu.cmu.lti.jawjaw.db.SQL.setPragmaCacheSize(SQL.java:137)
at edu.cmu.lti.jawjaw.db.SQL.createSQLConnection(SQL.java:99)
at edu.cmu.lti.jawjaw.db.SQL.<init>(SQL.java:55)
at edu.cmu.lti.jawjaw.db.SQL.<clinit>(SQL.java:45)
at edu.cmu.lti.jawjaw.db.WordDAO.findWordsByLemmaAndPos(WordDAO.java:124)
at edu.cmu.lti.jawjaw.util.WordNetUtil.wordToSynsets(WordNetUtil.java:38)
at edu.cmu.lti.lexical_db.NictWordNet.getAllConcepts(NictWordNet.java:38)
at edu.cmu.lti.ws4j.util.WordSimilarityCalculator.calcRelatednessOfWords(WordSimilarityCalculator.java:79)
at edu.cmu.lti.ws4j.RelatednessCalculator.calcRelatednessOfWords(RelatednessCalculator.java:61)
at web_cat.SimilarityCalculationDemo.run(SimilarityCalculationDemo.java:37)
at web_cat.SimilarityCalculationDemo.main(SimilarityCalculationDemo.java:43)
java.sql.SQLException: [SQLITE_CORRUPT] The database disk image is malformed (database disk image is malformed)
at org.sqlite.DB.newSQLException(DB.java:383)
at org.sqlite.DB.newSQLException(DB.java:387)
at org.sqlite.DB.throwex(DB.java:374)
at org.sqlite.NativeDB.prepare(Native Method)
at org.sqlite.DB.prepare(DB.java:123)
at org.sqlite.PrepStmt.<init>(PrepStmt.java:42)
at org.sqlite.Conn.prepareStatement(Conn.java:404)
at org.sqlite.Conn.prepareStatement(Conn.java:399)
at org.sqlite.Conn.prepareStatement(Conn.java:383)
at edu.cmu.lti.jawjaw.db.SQL.prepareStatements(SQL.java:151)
at edu.cmu.lti.jawjaw.db.SQL.<init>(SQL.java:56)
at edu.cmu.lti.jawjaw.db.SQL.<clinit>(SQL.java:45)
at edu.cmu.lti.jawjaw.db.WordDAO.findWordsByLemmaAndPos(WordDAO.java:124)
at edu.cmu.lti.jawjaw.util.WordNetUtil.wordToSynsets(WordNetUtil.java:38)
at edu.cmu.lti.lexical_db.NictWordNet.getAllConcepts(NictWordNet.java:38)
at edu.cmu.lti.ws4j.util.WordSimilarityCalculator.calcRelatednessOfWords(WordSimilarityCalculator.java:79)
at edu.cmu.lti.ws4j.RelatednessCalculator.calcRelatednessOfWords(RelatednessCalculator.java:61)
at web_cat.SimilarityCalculationDemo.run(SimilarityCalculationDemo.java:37)
at web_cat.SimilarityCalculationDemo.main(SimilarityCalculationDemo.java:43)
Exception in thread "main" java.lang.NullPointerException
at edu.cmu.lti.jawjaw.db.WordDAO.findWordsByLemmaAndPos(WordDAO.java:125)
at edu.cmu.lti.jawjaw.util.WordNetUtil.wordToSynsets(WordNetUtil.java:38)
at edu.cmu.lti.lexical_db.NictWordNet.getAllConcepts(NictWordNet.java:38)
at edu.cmu.lti.ws4j.util.WordSimilarityCalculator.calcRelatednessOfWords(WordSimilarityCalculator.java:79)
at edu.cmu.lti.ws4j.RelatednessCalculator.calcRelatednessOfWords(RelatednessCalculator.java:61)
at web_cat.SimilarityCalculationDemo.run(SimilarityCalculationDemo.java:37)
at web_cat.SimilarityCalculationDemo.main(SimilarityCalculationDemo.java:43)
Java Result: 1
我使用 Netbeans IDE 7.4 和 JDK 6。
任何人都可以帮助我,如何克服这个问题,因为互联网上关于 ws4j 的可用文档较少。
最佳答案
嗯,我无法重现您的错误。对我来说,它使用 Eclipse 开箱即用,非常完美,所以我会尽力帮助您准确地重现我所做的事情
从https://ws4j.googlecode.com/files/ws4j-1.0.1.jar下载ws4j-1.0.1.jar并确保下载后的大小为 41,362,723 字节(至少,这是 eclipse 在我的 linux 盒子中告诉我的)
使用java 7
创建一个简单的 Eclipse 项目并将 jar 放到那里。然后将jar添加到构建路径中(右键->构建路径->添加)
创建适当的包和类来容纳演示类
只需运行演示,您就会得到类似的结果
edu.cmu.lti.ws4j.impl.HirstStOnge 0.0
edu.cmu.lti.ws4j.impl.LeacockChodorow 1.3862943611198906
edu.cmu.lti.ws4j.impl.Lesk 0.0
edu.cmu.lti.ws4j.impl.WuPalmer 0.4
edu.cmu.lti.ws4j.impl.Resnik 2.5031573470157453
edu.cmu.lti.ws4j.impl.JiangConrath 0.11150424023847051
edu.cmu.lti.ws4j.impl.Lin 0.3582442863008455
edu.cmu.lti.ws4j.impl.Path 0.14285714285714285
Done in 1951 msec.
关于java - 我想使用 WordNet 查找单词相似度,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21646058/
我正在尝试为 WOLF(Wordnet Libre du Français,免费法语 Wordnet)创建一个界面。目标是为阿拉伯语 Wordnet (http://www.talp.upc.edu/
我正在尝试将 Wordnet 3.0 同义词集映射到 Wordnet 3.1例如:purl.org/vocabularies/princeton/wn30/synset-embrace-verb-2
虽然我拥有 EE 背景,但我没有机会参加自然语言处理类(class)。 我想为土耳其语构建情感分析工具。我认为最好创建一个土耳其语 wordnet 数据库,而不是将文本翻译成英语,然后使用提供的工具用
我对 WordNet 数据文件格式有疑问。 wndb(5) 手册页部分内容如下: The source/target field distinguishes lexical and semantic
一些相似度得分介于 0 和 1 之间,例如最短路径和 WuP。因此汽车与汽车之间的相似度将为 1,但 LCh 等其他度量将为 lch( car, automobile ) = 3.6889 我想知道这
是否有可用于 wordnet 3.0 同义词集到其他本体的映射,如 Cyc , YAGO和 EuroWordNet喜欢SUMO ? 最佳答案 Yago 是 linked to Wordnet , 以及
我正在尝试在 OSX 10.8 的 Mac 上安装 Wordnet 3.0。 我已经配置好了,但是当我尝试 make 时, 我收到一堆错误... ..... /usr/include/tkDecls.
想了解WordNet的文件格式,主要文档是WNDB和 WNINPUT .正如我在 WNDB 中所了解的,有名为 index.something 的文件和 data.something ,这里somet
如何使用 wordnet 按单词类别标记文本(java 作为接口(interface))? 示例 考虑以下句子: 1) 计算机需要键盘、显示器、CPU 才能工作。 2)汽车使用齿轮和离合器。 现在我的
我在java中使用wordnet,使用一些已知的api(JAWS、JWNL)。我想使用相同类型的 API 在 Wordnet Affect (WNA) 中进行搜索,但 Internet 上没有关于 W
我正在使用 WordNet 2.1 工具 并通过 JAWSpro-grammatically 访问它(Java用于 WordNet 搜索的 API)。 今天我遇到了一个名为 WordNet 域 的新事
我一直在分析 WordNet 3.0 MySql 数据库文件,我从以下位置下载了这些文件: http://www.princeton.edu/wordnet/download/current-vers
我正在尝试用 python 编写一个程序,它将记录我输入的段落。它将对该段落的第一句和最后一句以及带有日期和数字的句子进行排序。然后它会用同义词替换一些单词,并去掉无用的形容词。我知道 python
因此,我第一次尝试使用 wordnet 为我正在开发的基于小型文本的冒险游戏项目构建文本识别脚本。现在,我有这段代码来尝试构建一个对象,该对象由每个单词作为键以及该单词的每个同义词作为附加到该键的数组
我正在尝试编写一个程序来查找两个文档之间的相似性,并且由于我只使用英语,所以我决定使用 wordnet,但是我找不到将 wordnet 与 php 链接的方法,我找不到任何 wordnet api P
我用了rita使用 Java 框架 WordNet .它工作正常,但我如何在 android 中使用它?是否有任何框架/API 可以从 android 访问 WordNet? JAWS 要求安装 Wo
我一直在寻找一些 Java 库,它可以提供有关同义词集“频率计数”的信息。我检查了 JWNL 和 JWI,他们不提供此类信息。有人知道其他 Java WordNet API 吗? 最佳答案 我相信这也
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。 要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的,因为
我有一个项目,我需要获得一个单词的词汇含义。我正在考虑使用 WordNet,因为它有自己的词典编纂者类,也称为超感官。我刚刚下载了 MIT JWI 并试图查看这个 JWI 是否支持它。该手册没有说明返
假设我有两个句子中每对单词的单词相似度分数,根据这些分数确定整体句子相似度的合适方法是什么? 单词分数是使用代表每个单词的向量的余弦相似度计算的。 既然我有了单词得分,那么把单词得分加起来除以两个句子
我是一名优秀的程序员,十分优秀!