可定制、低延迟交互式计算机辅助翻译的利记博彩app_2

文档序号:9438932阅读:来源:国知局
计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(R0M)、可擦式可编程只读存储器(EPR0M或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
[0026]计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括一一但不限于一一电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
[0027]计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括一一但不限于一一无线、有线、光缆、RF等等,或者上述的任意合适的组合。可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言一诸如Java、Python,、C++等,还包括常规的过程式程序设计语言一诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络一一包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
[0028]下面将参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述本发明。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机程序指令实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些计算机程序指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。
[0029]也可以把这些计算机程序指令存储在计算机可读介质中,这些指令使得计算机、其它可编程数据处理装置、或其他设备以特定方式工作,从而,存储在计算机可读介质中的指令就产生出包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的指令的制造品(article of manufacture)。也可以把计算机程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机或其它可编程装置上执行的指令提供实现流程图和/或框图中的一个或多个方框中规定的功能/动作的过程。
[0030]附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0031]在说明书中对本发明原理的“一个实施例”或“一实施例”以及其其它变型的引用,意味着与该实施例相关地描述的特定特征、结构或特性等包含在本发明原理的至少一个实施例中。因此,在贯穿说明书在各处出现的短语“在一个实施例中”和“在实施例中”以及任何其它变型,并不必都指同一实施例。
[0032]应当理解,下文中和/或”以及“至少……之一”中任何一个的使用(例如在“A/B”、“A和/或B”和“至少A和B之一”的情况下),意图包含仅选择先列出的选项㈧、或者仅选择第二列出的选项(B)或者选择两个选项(A和B)。作为另一个例子,在“A、B和/或C”以及“至少A、B和C之一”的情况下,这种短语意图包含:仅选择第一列出的选项(A)、或者仅选择第二列出的选项(B)、或者仅选项第三列出的选项(C)、或者仅选择第一和第二列出的选项(A和B)、或者仅选择第一和第三列出的选项(A和C)、或者仅选择第二和第三列出的选项(B和C)、或者选择所有三个选项(A和B和C)。对于本领域普通技术人员而言容易显而易见的是,对于同样数量列出的项目这可以扩展。
[0033]现在参考图2,显示了在CAT中提供和更新建议的方法。框202如上所述生成建议池。建议池基于通用翻译模型和一个或多个可定制翻译模型。框203确定在输入文档中是否有未翻译句子。如果是,框204使用建议池为输入文档中第一个未翻译句子生成最好句子翻译。最好句子可以是几个可能句子翻译中的一个并且可以根据任何适当方法选择。例如,每个潜在翻译可以根据该翻译正确的可能性分配对应的置信度评分。决定为最有可能的翻译的建议呈现给翻译者以供接受。
[0034]在框206,翻译者有接受或拒绝该建议的选择。用户可以使用,例如,键盘快捷键,做出选择,从而尽可能有效率地做出接受或拒绝。如果翻译者接受建议,框207在输入文档中选择下一个句子并返回处理到框203,其确定是否还有剩余句子。如果翻译者拒绝建议或者仅接受建议的一部分,翻译者可用开始在框208中输入翻译。如果翻译者接受部分的建议,则翻译者在接收的前缀的后面开始输入翻译信息。
[0035]当用户输入信息,框210更新建议。CAT系统匹配前缀与建议池。如果匹配,在候选翻译的匹配前缀后的下几个单词将被建议。当系统从用户读入更多输入,用户的翻译限制可能建议的数量并且可以为该句子做出最可能翻译的新建议。框210显示新建议和允许用户在框206中接受建议。用户可以继续输入翻译,这隐含拒绝新建议。这继续直到翻译者要么手工完成句子翻译要么接受翻译建议。在输入文档每个句子以这方式处理直到整个文档已经翻译完。
[0036]一旦框203确定没有句子剩余,框212可以使用在翻译时学到的附加句对选择性地更新定制翻译模型。该更新可以包括更新整个模型或可以是仅在模型中对参数的权重的更新。块212可以在任何时刻执行更新,但由于更新可能耗时且计算密集,离线更新模型可能更有效。或者,对模型的增加的更新可以在后台在线执行。这允许CAT系统适用于特定词汇和在文档中找到的特定使用。
[0037]现在参考图3,显示了 CAT系统300。该系统包括处理器302和存储器304。存储器304中存储的的训练数据由模型更新模块使用以创建和更新一个或多个定制翻译模型308,并且与通用翻译模型306存储在存储器中。池更新模块312使用处理器302以通过使用通用翻译模型306以及定制翻译模型308为输入文档中的句子生成建议池310。翻译模块316使用处理器302以审阅建议池310并为输入文档中的句子提供翻译建议。翻译模块316接收用户输入并自适应地在建议池中重新评估这些建议,当用户的输入取消了翻译选项则提供更新的建议。模型更新模块314使用处理器302以使用由用户的翻译收到的信息更新定制翻译模块308。
[0038]尽管图描述了单个系统300,应当注意,显示的功能模块并不需要在单个硬件中实现。例如,定制翻译模型可以在服务器装置被生成、存储和更新,和只根据需要传输给翻译者的客户装置。
[0039]现在参考图4,在框210提供关于更新建议池的更多细节。框402生成建议池,其包括,例如,修剪的翻译格,该翻译格紧凑表示源句子的可能短语翻译集,并向翻译者发送句子。当翻译者改变翻译前缀时,框404创建新的建议池。框406向翻译格增加任何新候选者和修剪不再有效的任何候选者。由于翻译格编码最可能的翻译,但无需包含所有可能翻译,该格基于翻译者提供的输入进行更新以反映最可能翻译的变化。
[0040]框406,在修剪可能翻译中,为每个可能翻译做出可能性测定。阈值被用来决定给定可能翻译是否将被放入建议池,如此可能性高于阈值的翻译被用作该池中而低于该阈值的翻译则被从该池中修剪。可以由任何合适机制产生可能性,例如由词的共性、文档上下文等生成每个翻译的得分。框406也可以基于用户的前缀向服务器请求额外候选者、向建议池增加
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1