gpt4 book ai didi

python-3.x - python中的TMX(翻译内存交换)文件

转载 作者:行者123 更新时间:2023-12-04 19:07:45 25 4
gpt4 key购买 nike

是否有用于在 python 中处理 TMX(Translation Memory eXchange) 文件的模块,如果没有,另一种方法是什么?

就目前而言,我有一个巨大的 2gb 文件,带有法英字幕。甚至可以处理这样的文件还是我必须将其分解?

最佳答案

正如@hurrial 所说,您可以使用translate-toolkit .
安装
此工具包仅可使用 pip。要安装它,请运行:

pip install translate-toolkit
用法
假设您有以下简单的 sample.tmx文件:
<tmx version="1.4">
<header
creationtool="XYZTool" creationtoolversion="1.01-023"
datatype="PlainText" segtype="sentence"
adminlang="en-us" srclang="en"
o-tmf="ABCTransMem"/>
<body>
<tu>
<tuv xml:lang="en">
<seg>Hello world!</seg>
</tuv>
<tuv xml:lang="ar">
<seg>اهلا بالعالم!</seg>
</tuv>
</tu>
</body>
</tmx>
您可以像这样解析这个简单的文件:
>>> from translate.storage.tmx import tmxfile
>>>
>>> with open("sample.tmx", 'rb') as fin:
... tmx_file = tmxfile(fin, 'en', 'ar')
>>>
>>> for node in tmx_file.unit_iter():
... print(node.source, node.target)
Hello world! اهلا بالعالم!
欲了解更多信息,请查看 here 的官方文档.

关于python-3.x - python中的TMX(翻译内存交换)文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20356149/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com