在TM中,每个翻译单元按照源语言的文字分段及其对应的翻译语言成对存储。
这些分段可以是文字区块、段落、单句。
术语库 Term Base
存储术语翻译及相关信息的数据库。多个译员通过共享同一术语库,可以确保术语翻译的一致性。
基于规则的机器翻译 Rule-based MT
指对语言语句的词法、语法、语义和句法进行分析、判断和取舍,然后重新进行排列组合,生成对等意义的目标语言文字的机器翻译方法。
基于统计的机器翻译 Statistic-based MT
以大量的双语语料库为基础,对源语言和目标语言词汇的对应关系进行统计,然后根据统计规律输出译文的机器翻译方法。
内容管理系统 Content Management System (CMS)
用于创建、编辑、管理、检索以及发布各种数字媒体(如音频、视频)和电子文本的应用程序或工具。
通常根据系统应用范围分为企业内容管理系统、网站内容管理系统、组织单元内容管理系统。
伪本地化 Pseudo Localization
把需要本地化的字符串按一定规则转变为“伪字符串”并构建伪本地化版本的过程。在伪本地化的软件上进行测试,可以验证软件是否存在国际化问题,用户界面控件的位置和大小是否满足特定语言的要求。
硬编码 Hard Code
一种软件代码实现方法,是指编程时,把输入或配置数据、数据格式、界面文字等直接内嵌在源代码中,而不是从外部数据源获取数据或根据输入生成数据或格式。
缺陷 Bug
软件产品在功能、外观或语言描述中存在的质量问题。通常在质量保证测试期间由测试工程师将发现的缺陷上报,并分别由客户方、本地化工程人员或翻译人员解决。
优先级 Priority
同时存在多种选择时应遵循的先后次序,如词汇优先级、本地化样式手册优先级、缺陷优先级等。
例如:在软件本地化过程中,缺陷的优先级通常按如下规则确定:
·缺陷应立即修复,否则产品不能发布;
·缺陷不需要立即修复,但如果不修复,产品不能发布;
·缺陷不是必须修复,是否修复取决于资源、时间和风险状况。
严重程度 Severity
指所发现的缺陷对相关产品造成影响的严重程度。严重程度较高的缺陷可能会影响产品的按时发布。
软件缺陷的严重程度通常分为四级:
·关键 (Critical):导致系统或软件产品自身崩溃、死机、系统挂起或数据丢失,主要功能完全失效等;
·高 (High):主要功能部分失效、次要功能完全失效、数据不能保存等;
·中 (Middle):次要功能无法完全正常工作但不影响其他功能的使用;
·低 (Low):影响操作者的使用体验(如感觉不方便或不舒服),但不影响功能的操作和执行。
重复 Repetition
在翻译字数统计中,重复是指源语言中出现两次及以上的相同文本。
模糊匹配 Fuzzy Match
源文件中的待翻译单元与翻译记忆库中翻译单元的源语言局部相同。模糊匹配的程度通常用百分比表示,称为复用率。
完全匹配 Full Match
源文件中的待翻译单元与翻译记忆库中翻译单元的源语言完全相同,其模糊匹配的程度(复用率)为100%。
新字 New Word
模糊匹配程度(复用率)低于某一设定阈值的源语言单词或基本语言单位。
加权字数 Weighted Word Count
根据待翻译单元的复用率,对其字数加权计算后得到的待翻译字数。