大字符集简笔汉字输入法及其键盘的利记博彩app

文档序号:6601572阅读:976来源:国知局
专利名称:大字符集简笔汉字输入法及其键盘的利记博彩app
技术领域
本发明涉及一种用于电脑汉字输入的汉字编码方法及其输入键盘。
我国已开发了许多有效的汉字输入方案,其中以字形编码方案居多,但这些方案的学习记忆量仍嫌过大,即使学会了、记住了,隔一段时间不用又容易忘记。广大非职业电脑打字员爱用的汉字全拼音输入法具有即学即会地特点,但重码率太高,此外还要求人们准确掌握每个汉字的发音,可是绝大多数中国人只能对常用的四、五千个左右的汉字正确发音。现在已开始推广应用新的大字符集汉字国家标准GB-13000-这也是国际标准,在该标准中规定了20902个汉字,这个数目还在不断扩大。这表明在新的国际和国家标准汉字集中,有一万五千个以上的汉字是绝大多数中国人不知其正确发音的。对这许多汉字,全拼音输入法就不太适用,因为即使对专职打字员,要记住一万五千个以上的非常用汉字的正确发音也是一件不容易的事,而且采用拼音输入法输入两万多汉字时的重码字将多到不能容忍的地步。
本发明的目的在于提供一种以键代笔的自然书写式简笔汉字输入法,适用于大字符集汉字输入,易学易记,具有很高的编码效率和相当低的重码率。
本发明的又一目的在于提供根据上述的大字符集简笔汉字输入法进行汉字输入的键盘。
本发明的技术方案如下
本发明的汉字编码方法,是将汉字的基本笔画归并为横[一]、竖[丨]、撇[丿]、点[丶]、右折[
]、左折[亅]六类,每一类基本笔画中包含类似的笔画,取该类基本笔画的代表笔画为基本码元,对应关系列表如下
笔画类型 基本码元 类含基本笔画
横 类一一
竖 类丨丨
撇 类丿丿
点 类 丶 丶 _
右折类


左折类亅亅


其中横类含笔画横、斜横与挑,竖类含笔画竖和斜竖,点类含笔画点和捺,撇类含笔画长撇和短撇,右折类含那些在书写收笔时运笔为反时针方向或/和向右趋的折画,左折类含那些在书写结束时运笔为顺时针方向或/和向左趋的折画。利用上述六类基本笔画已可为任何一个汉字编码,但为了提高汉字输入效率,把按规范笔顺一气写成的字元“十”、和“口”也看作本方案的基本码元。作为基本码元的“十”应是依先横后竖的笔顺一气写成的,而先竖后横写出的十字架不是本方案的基本码元。在本方案中
和乂二个字元也看作基本码元“十”。作为基本码元的“口”应是依笔顺连续一气写成的,例如“呵、中、串、虫”等字中的字元“口”是本方案的基本码元“口”,而“回、国”等字中的外口因为不是连续写成的,不是本方案的基本码元“口”。
这样,本发明的基本码元总共是八个,即一、丨、丿、丶、
亅、十、口。利用这八个基本码元为一切汉字编码。在给一个汉字编码时依国家规范笔顺仅取每字的前面三码和最后二码。不足五码的取完为止。
为了提高编码效率和降低重码率,对一些指定的字元采取特殊的笔画省略原则,即对指定的一些字元只抽取其中的特征笔画而省略其它笔画。这也是本发明叫简笔汉字输入法的因由。上述指定字元的特殊省笔规则如下
a.以下字元仅取其首笔或末笔或中腰一笔或省去口中各横笔,其
中“十”和“口”视为一笔。
字元基本码元字元 基本码元
艹 一 钅
亻门門 丨 扌冖 亅
冫氵广 丶 木


日目
口 月
爫 丿
其中的“
、木、
”如果是汉字的最后一个字元,则多取一笔,即取“十、丿”;对于“亻”,在一个汉字中仅当它不与该字的其它笔画相交连时才省笔,例如在“有、在”等字中的第二、第三两个笔画就不是本方案中的特殊字元“亻”,不省笔。
b.以下字元仅取头二笔或末二笔
字元 基本码元 字元 基本码元字元 基本码元
彳 丿 丿女
丿 气 一
尸亅 一 _火 丶丿 攵
一十
_十 丨 大
一丿 万 一亅

丶 亅犭 丿亅小 亅丿
_丿 一 心丶
丨丿

西
酉 一丨忄丶丨c.以下字元仅取首尾二笔
字元 基本码元字元基本码元
言咅_口幺

_
虫 口_
石 一口
d.以下字元仅取其中特征性的二笔或三笔
字元 基本码元 字元基本码元字元 基本码元


_十 礻衤 亅丨 灬 __
欠 丿丿
亅一 馬 一亅
饣食食 亅
贝貝 丨丿 山屮

马鸟烏 亅亅 田由 丨十 戈 一
_
鱼魚 丨_
丨 车

在上述省笔规则中,所选定的字元和所抽取的特征笔画都是经过精心没汁的,并经过计算机的反复运算优化。从而保证本方案在仅仅八个基本码元。每字至多只取五码的条件下能大大降低重码率和重码度,使本发明获得优良的技术性能。简笔汉字输入法由干基本码元极少,省笔规则也只涉及60来个特殊字元,这使得本发明从根本上摆脱了各种传统形码方案的难学难记困境。同时,由于本发明采用严格依国家规范笔顺的书写式取码规则,没有传统形码的拆字与取码歧义性难题,容易掌握。由于基本码元极少,本发明简笔输入法的盲打指法训练期极短。
本发明的词编码规则如下
a.双字词取每字的前三个码;
b.三字词取每字的前二个码;
c.四字词前两字各取前二个码,后两字各取第一码;
d.五字词取第一字的前二个码及其它字的第一码;
e.六字词取各字的第一码;
f.七字词以上取前五字及最后一字的第一码;
本发明对词组统一采用六键输入。
根据本发明的简笔汉字输入方法,可设计出四种用于汉字输入的键盘方案,前三种键盘方案的形式都是采用现行标准键盘上的八个特定字符键分别与本发明的八个基本码元对应以实现汉字输入。第四种是全新的中西兼优方案。
四种方案的基本码元与键盘字符的对应关系如下表一
方案一用8个数字代表八基本码元,使得可以用数字键实现汉字输入,这为某些数字系统提供了高性能的汉字输入手段。其中前四个数字表示与传统文字学的五个基本笔画中前四个笔画的数字表示一致,而传统的折画在本发明中划分为两类即右折与左折,分别用5和6表示。
方案二用五个韵母及元音字母加上v和/及;三个字符代表八基本码元,其中e代表横“一”,e与一同音;i代表竖“丨”,i的大写与竖同
形;O的写法与右折相同,代表右折;V也是折的写法,并在键盘左部,代表左折。上述音、形上的类似有助于码元符号的记忆。
方案二的优点是保留全部20个声母字符即辅音字母为汉字编制简码。其中最高频的40个汉字用20个声母字符的大写或小写作为它们的一键简码。次高频的几百个汉字则取其简笔字形首码和其声母字符的大写或小写构成它们的二键简码。
方案三和四分别用现行西文键盘和图一所示的新的中西兼优键盘的中排八个基本键代表八基本码元实现汉字输入。
本发明简笔汉字输入法用八个基本码元即八个基本字形为一切汉字编制基本码,这是地地道道的形码。表二是简笔汉字编码输入法的编码实例。
表二
表三
方案三和四的优点是输入汉字时,手指击键动作范围最小。局限于中排基本键。这有助于汉字输入速度的提高。方案三和四不需要操作员记住八基本码元的中排基本键代码,而是把八基本码元与操作员双手八指位建立固定的永久的一一对应关系如表三。上机时,操作员双手往键盘上一放,通过操作员正规的标准指位实现八基本码元与中排八个基本键盘字符的自然的对应,使得操作员不必再记八基本码元的所对应的键盘字符。困此方案三和四的汉字基本码仍是表二第一排的简笔形码,汉字在表二第四排和第五排的键盘字符码只是方案三和方案四汉字的机内码。操作员不必与这些机内码打交道。那是软件人员关心的事。
按方案三和四,不仅双手八指位在中排所击之键代表向电脑键入了八基本码元,在上排、下排的八指位所击之键同样表示向电脑键入了相应的基本码元,它们分别叫作基本码元的上排、下排同义码,分别由基本码元加上画线和下画线表示上排同义码
下排同义码
除此之外,在三排字母键的下档[shift]键八指位所击之键同样表示向电脑键入了相应的基本码元,它们分别叫下档同义码。前述上、中、下三排上档同义码的码元符号都用宋体字形表示。而下档的三排同义码都用黑体字形表示。下档上排、下档中排、下档下排同义码分别表示为下档上排
下档中排一 丨丿_
亅 十 口下档下排
我们把中排上档同义码特称主码。本方案用基本码元中的主码为汉字编制基本码,而其它五种同义码主要在方案三和四中编制汉字简码及词码,而且仅作为简码码和词码的尾码。
六种同义码—包括主码—叫作简笔输入法方案三和四的外部码,它们通过操作员双手所对应的键盘字符叫作简笔输入法方案三和四的机内码。在方案三和四的实施中,操作员仅与外部码打交道,完全不必关心和记忆汉字的任何机内码——这留给软件人员去处理。
三排上下档同义键可以纵向划分成八列同义键,分别叫横列键、竖列键……11列键等等。
本方案的简码编制规则如下
挑出使用频率最高的八组48个字,每组有六个具有相同首码的汉字,八个组的首码各各不同。对这48个高频汉字删去其它各码而仅保留首码构成单码汉字。但每组中六个字的首码单码分别用六个同义码表示。这些汉字于是可以一键输入。但用主码表示的简码字在键入主码后应加击一次空白键作为该字的输入结束标志。其它五个同义码则本身就是结束标志。本方案可以至多编出8×8×6=384个次高频汉字的双键简码这些字仅取第一、第二码而略去其它各后继码。这些字的首码都是主码,第二码则除主码外同时使用主码的其它5个同义码。一个双键简码的第二码如是主码,在击完该键后应加击一次空白键作为该简码字的结束标志,如果第二码是其它5种同义码,由于这五种同义码本身就是结束标志,因此击完第二键的同义键后立即可输入下一字。
以下是方案三和四的一些简码汉字实例
其中“就”字是高频字,有单键简码,由主码“丶”表示,在击入“点”键即d键后应加击一次空格键才能输入下一字。“我”字的简码是“
”,即“丿”的上排上档同义码,在用右中指击上排上档键后立即可以开始键入下一汉字。学字有双键简码。输入时击完第二键即点的上排同义键后立即可输入下一汉字。
方案一的数字键汉字简码可以由本方案三的简码经表四的符号变化得到。
表四 方案三汉字简码至方案一数字键简码字符替换表
本方案三右小指按标准指法击中排上档键表示输入了逗号,左小指按标准指法击中排上档键表示键入了一个句号,而用左小指、右小指先后击键表示分号,右小指、左小指先后击键表示问号,左小指连击表示是冒号,右小指连击表示引号。这样做,使得主要标点符号都可集中在中排基本键输入,缩小标点符号输入时的手指动作范围。
方案三和四在发生重码时,重码字依使用频率降序分别显示在与键盘的横列键、竖列键、撇列键、点列键、右折列键、左折列键、十列键和口列键相对应的位置,且在它们的旁边分别依次标记以码元符号一、丨、丿、丶、
十、口等。操作员通过击相应列的中排主键来选择所输入的目标字。这样作比传统重码甄别方法把重码字依使用频率降序用数字标识更好。用数字标识时,最高频字用1、2标识,这恰恰是对应着左小指位和左无名指位,左小指反应最慢,左无名指反应也较慢。此外,由于数字键离中排基本键最远,击数字键的动作时间比击中排基本键的动作时间要长。本方案使高频重码字对应左、右食指及左、右中指指位,并通过击中排键选择重码,重码甄别反应比传统方法为快。
方案三基本码元的键位布局设计和简码编制规则保证了在汉字文本信息输入时,右手的击键概率高于左手,食指本位、中指、无名指、小指、食指偏移位[延伸位]的击键概率依次递减,中排键、上排键、下排键的击键概率依次递减。这使得汉字键盘的信息输入效率得到最充分的发挥,即使得汉字信源与汉字键盘获得准最优的信道匹配。
上述方案三在汉字键盘的键位布局设计优化后,汉字基本码元键与汉字文本的标点符号键同西文字母键与西文文本标点符号键之间发生了冲突。例如,在方案三中,原西文古典键盘的字母a用作了汉字文本的句号,而古典键盘的;号键则作了汉字文本的逗号。此外,原古典键盘的逗号和句号则作了方案三的汉字基本码元的同义键……等等。这是汉字键盘设计囿于原西文键盘的结果。
表五所示本发明的汉字键盘方案四消除了上述缺点。这是一种完全新型的中西兼优的键盘,其特征在于
a.用方案四的键盘输入汉字的方法和优点与方案三相同,只是部分使用概率较低的标点符号有所区别。但方案四消除了方案三汉字文本标号符号输入与西文文本标点符号输入不一致的缺点。
b.方案四把使用概率较高的逗号和句号分置于手指击键较快的中排基本键,而使用概率较低的分号和问号则置于击键较慢的下排键。并且,主要标号符号键不再插在26个英文字母键的中间,而是分置两边,使键位布局更具形式美,还消除了把西文文本逗号键和句号键用作汉字基本码元同义键的内在的不和谐。
c.方案四在继续保持与汉字信源优良匹配的同时,改进了英文信息键盘输入的性能。新键盘与英文信源的信道匹配状况在以下多个方面优于原古典西文键盘
d.打字员击中排基本键最快,上排次之,下排再次,数字键最次。方案四的键盘在输入英文时保证了各排键被击概率按以上次序递减,而古典西文键盘上排键的使用概率过高。
e.英文输入时,A是高频字母[使用概率列第三位],在古典键盘上被置于最不灵敏的左小指键位,而使用概率很低的字母J[在26字母中使用概率为倒数第四位]却置于最灵敏的右手食指本位。在新的中西兼优键盘中这两字母的位置分别上提和下降三个等级,A提到右手中指中排键位,J降为左手中指下排键位。
f.绝大多数人右手比左手更灵敏,因此右手击键概率应高于左手,新键盘右手比左手高7.62%,而古典键盘右手比左手反而低13.56%。
g.通常,食指、中指、无名指、小指的灵敏度依次递减,新的中西兼优键盘的键位使用概率与此相适配并优于原来的标准西文键盘。
h.食指击延伸指位键比击自然指位键明显要慢。表五的新键盘与此相适应,在汉字与西文输入时,两手食指的自然指位键的击键概率显著高于延伸指位键。
i.击键操作表明单指连击比异指交替轮击的速度要慢得多,因此键盘设计应力求降低单指连击概率。在这方面,古典西文键盘作得相当好,但仍有一缺点,单指连击概率的指位分布仍不合理。食指和中指连击速率高于无名指和小指的连击速率,但古典键盘右无名指的连击概率是右中指的9倍多!相比之下,表五的新键盘的单指连击概率的指位分布很合理右、左两小指的连击概率实际为0,右、左无名指的连击概率稍大,连击概率主要集中于食指和中指。
表五 中西兼优键盘的键位布局
不在表五之中的其它字符键的位置则仍保持与原古典西文键盘一致
权利要求
1.一种大字符集谢氏简笔汉字输入法,其特征在于将汉字的基本笔画归并为横[一]、竖[丨]、撇[丿]、点[丶]、右折[
]、左折[亅]六类,每一类基本笔画中包含类似的笔画,取该类基本笔画的代表笔画为基本码元,对应关系列表如下
笔画类型 基本码元 类含基本笔画
横 类 一 一
竖 类 丨 丨
撇 类 丿 丿
点 类 丶 丶 _
右折类


左折类 亅 亅


其中横类含笔画横、斜横与挑,竖类含笔画竖和斜竖,点类含笔画点和捺,撇类含笔画长撇和短撇,右折类含那些在书写收笔时运笔为反时针方向或/和向右趋的折画,左折类含那些在书写结束时运笔为顺时针方向或/和向左趋的折画;此外,把按规范笔顺一气写成的字元“十”、和“口”也看作本方案的基本码元;在本方案中
和乂二个字元也看作基本码元“十”;这样,基本码元总共是八个,即一、丨、丿、丶、
、亅、十、口,利用这八个基本码元为一切汉字编码;在给一个汉字编码时依国家规范笔顺仅取每字的前面三码和最后二码共五码,不足五码的取完为止。
2.根据权利要求1所述的大字符集谢氏简笔汉字输入法,其特征在于为了提高编码效率和降低重码率,对一些指定的汉字字元采取特殊的笔画省略规则,即对指定的一些字元只抽取其中的特征笔画而省略其它笔画。
3.根据权利要求2所述的大字符集谢氏简笔汉字输入法,其特征在于所指定的特殊字元及其特殊的笔划省略规则如下
a.以下字元仅取其首笔或末笔或中腰一笔或省去口中各横笔,其
中“十”和“口”视为一笔
字元基本码元字元 基本码元
艹一 钅
亻门門丨 扌冖亅
冫氵广丶 木


日目
口 月
爫 丿
其中的“
、木、
”如果是汉字的最后一个字元,则多取一笔,即取“十、丿”;对于“亻”,在一个汉字中仅当它不与该字的其它笔画相交连时才省笔;
b.以下字元仅取头二笔或末二笔
字元 基本码元字元 基本码元字元 基本码元
彳 丿丿 女
丿 气 一
尸 一 _火丶丿 攵
一 十
_ 十丨 大
一丿 万 一亅

丶亅犭 丿亅 小 亅丿
_丿一 心 丶
丨丿

西
酉一丨 忄 丶丨
c.以下字元仅取首尾二笔
字元基本码元字元 基本码元
言咅丶口 幺


虫 口丶
石 一口
d.以下字元仅取其中特征性的二笔或三笔
字元 基本码元字元基本码元字元 基本码元


丶十 礻衤 亅丨 灬丶丶
欠 丿丿
亅一 馬一亅
饣食食 亅
贝貝 丨丿 山屮

马鸟鳥 亅亅 田由 丨十 戈一
丿
鱼魚 丨十
丨 车

4.一种根据权利要求1或2所述的大字符集谢氏简笔汉字输入法所设计的键盘,其特征在于采用键盘上1至8等八个数字键代表八个基本码元向计算机输入汉字。
5.一种根据权利要求1或2所述的大字符集谢氏简笔汉字输入法所设计的键盘,其特征在于采用键盘上的五个元音字符e、i、u、a、o和v分别表示横、竖、撇、点、右折和左折等六个基本码元,采用键盘上的“/”和“;”两个字符分别表示“十”和“口”两个基本码元,其对应关系如下
基本码元 一丨 丿 丶
亅 十 口
字符代码 eiu aov/;
6.一种根据权利要求5所述的汉字键盘,其特征在于键盘上的二十个汉字声母[辅音]字符用于为输入方案的汉字编制一键简码和二键简码,其中最高频的40个汉字用20个声母字符的大写或小写作为它们的一键简码,次高频的几百个汉字则取其简笔字形首码和其声母字符的大写或小写构成它们的二键简码。
7.根据权利要求1或2所述的大字符集简笔汉字输入法,其特征在于把一、丨、丿、丶、
、亅、十、口等八种基本字形作为基本码元为一切汉字编码,并且以双手八个指位与八个基本码元固定对应,即以右、左食指本位分别对应横与竖,右、左食指延伸位分别对应十和口,右、左中指分别对应撇和点,右、左无名指分别对应右折和左折,双手八指位在三排上、下档字符键依正规标准指法操作所击发的信号都键入了该指位所表示的基本码元,在中排上档的击键则作为主码,基本码由主码表示,其它五种是同义码,同义码用于简码和词码的尾码。
8.根据权利要求7所述的大字符集简笔汉字输入法,其特征在于挑出使用频率最高的八组48个汉字,每组有六个具有相同首码的字,八个组的首码各各不同,对这48个高频汉字删去其它各码而仅保留首码构成单码汉字,但每组中六个字的首码单码分别用六个同义码表示;另外可以至多编出8×8×6=384个次高频汉字的双键简码这些字仅取第一、第二码而略去其它各后继码,这些字的首码都是主码,第二码则除主码外同时使用主码的其它5个同义码。
9.根据权利要求7所述的大字符集简笔汉字输入法,其特征在于重码依使用频率降序显示在屏上与各列同义键相对应的位置,且每个重码字旁边显示所对应的列基本码元即一、丨、丿、丶、
十、口,操作员通过击相应的中排基本键甄别重码。
10.根据权利要求7的大字符集简笔汉字输入法,其特征在于以右小指按标准指法击中排上档键表示逗号,左小指按标准指法击中排上档键表示句号,用左小指、右小指先后击中排基本键表示分号,右小指、左小指先后击中排键表示问号,左小指在中排连击表示冒号,右小指在中排连击表示引号。
11.根据权利要求7所述的大字符集简笔汉字输入法所设计的中西兼优键盘的特征在于把原标准西文键盘的主要字符键的键位布局作如下的变换
原来标准的ASCII键盘的QWERTYUIOP分别依次以VBCRGPMHUQ替换;
原来标准的ASCII键盘的ASDFGHJKL分别依次以.IESWNTOA,替换;
原来标准的ASCII键盘的ZXCVBNM<>?分别依次以?ZJDKXFLY;替换;
其他键位仍然维持原来的西文键盘布局不变。
全文摘要
本发明涉及一种汉字拼形编码输入法—大字符集谢氏简笔汉字输入法及其键盘。本输入法在设计原理上与传统形码迥然不同。它仅用八个基本汉字字形作为基本码元依国家规范笔顺直接为一切汉字编码,避免了用拉丁字符为汉字编码这个中间环节,并绕开了传统形码把数百个基本字元进行排列组合与拆分所带来的困扰,克服了形码的学习与记忆难题,实现了以键代笔的自然书写式高效汉字键盘输入。由于只有八个基本码元,平均每字仅四码,因此学习记忆量最小,盲打指法训练期最短,汉字编码效率很高,既适合汉字电脑的偶然用户,也适合专职打字员。
文档编号G06F3/023GK1165334SQ9511252
公开日1997年11月19日 申请日期1995年11月8日 优先权日1995年11月8日
发明者谢克中, 谢列妮 申请人:谢克中
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1