gpt4 book ai didi

dictionary - 我正在寻找字典源文件格式和相关工具

转载 作者:行者123 更新时间:2023-12-02 02:23:07 26 4
gpt4 key购买 nike

我正在寻找便于在通用文本编辑器(我使用 Emacs)中编辑并且可以在版本控制下存储(并允许轻松合并)的字典源文件格式。

这样我就可以与其他人分享我在字典方面的工作。

如果没有将字典源转换为索引形式以用于字典软件文件格式的支持工具,则无法使用。

作为客户端词典软件,我使用 GoldenDict:http://goldendict.org/dictionaries.php它理解许多索引字典文件格式,但如果您推荐,我会切换到另一种格式。

以前我使用TAB格式(StarDict的原始文件格式,转换为.dict.dz/.idx/.ifo)。这是丑陋的!每个单词定义必须保持在单行中,并且与 TAB 定义的单词分开。看:

be  be [] (inf.)\n was/were [] (past ind.)\n been [] (past part.)\n     (infinitive) быть, нести, родить

接下来我尝试使用 Dictd 文件格式。好多了:

  $ cat my.txt...adj.adjective   [ˈæʤɪktɪv]   adj.   adjective   прилагательное  $ dictfmt -f \      --utf8 --allchars --case-sensitive \      -s 'Usual dictionary abbreviations.' \      my <my.txt 

我也知道 http://xdxf.sourceforge.net/ .但深看说这是死项目。并且有两个明显的遗漏:

  • 有噪音的XML排版很难写文章
  • 没有工具可以将源代码转换为可用的词典(您只能转换为其他源格式,然后生成可用的词典...)

我在寻找更好的解决方案...


为什么?我学习外语,想创建所学单词的词典来修改它们并进一步使用。

我还参与了开源软件项目手册和免费书籍的翻译,并希望维护术语列表,以便翻译人员之间共享创建的词典以保持一致的翻译。

最佳答案

正如我所说,stardict 的 TAB 文件是 DUMB。

目前我使用 dict-c5 格式(我邮寄给 http://sourceforge.net/projects/dict/ 开发人员,他说这是更合适和推荐的格式):

  $ dictfmt -c5 --headword-separator '; ' --break-headwords \  --utf8 --allchars --case-sensitive \  --mime-header 'Content-Type: text/html' \  -s 'Usual dictionary abbreviations.' -u http://gavenkoa.users.sourceforge.net/ \  ${prefix_for_output} <${input}

对于文章:

_____adj.; adjective  [ˈæʤɪktɪv]  adj.  adjective  прилагательное_____adv.; adverb  []  adv.  adverb  наречие

GoldenDict 的作者推荐使用 Abby Lingvo DSL 丰富的格式,它允许对粗体/斜体、颜色等进行格式化。要获取描述,请使用 Lingvo 发行版中的 Lingvo0.chm。查找示例:

chat  [m1][p][i][c][com]m[/com][/c][/i][/p][/m]  [m1][trn]кот, кошка;[/trn][/m]  [m2][*][ex][lang id=4]Chat botté[/lang] — Кот в сапогах;[/ex][/*][/m]  [m2][*][ex][lang id=4]jouer à chat perché[/lang] — играть в кошки-мышки[/ex][/*][/m]

关于dictionary - 我正在寻找字典源文件格式和相关工具,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7198323/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com