专利名称:拼音加偏旁部首代码汉字输入法的利记博彩app
近年来微机汉字处理系统给人们带来莫大的方便。但输入问题一直被称作“瓶颈问题”。多年来,人们在刻意寻求一种简单、易学、快捷的输入方法,出现了几百种编码和方法,其特点是,大多数使用小键盘,大体上分为拼音、拼形和音形结合三大类。其中拼形输入在解决专业人员的录入问题上取得了一定成效。但无论那一种方法,真正在普及性、大众化方向上还很不尽人意。问题并没有得到真正的解决。拼音加偏旁部首代码汉字输入法便是为彻底解决这一问题而设计的。为行文方便本文一律将拼音加偏旁部首代码汉字输入法,按汉语拼音缩写成PJP汉字输入法。
PJP汉字输入法是一种将偏旁部首检字法在微机上应用的方法,是为非专业录入人员提供的一种普及型汉字输入法,PJP是一种以拼音为主的音形输入法。据有人统计现在使用拼音输入的人在70%以上,以实现普及性和“想打”为目的的输入法,选用与思维相一致的拼音为主较为合适。在取形上PJP取了汉字的偏旁部首。这些知识人们从小学一年级起就开始逐步学习和使用,四年级就已经掌握,要求知识背景浅,极易普及。
PJP的设计是要在不破坏音节的前提下,将所有的同音字区分开来,所以在选择代码时在26个拉丁字母中删去了“a、o、e、i、u”五个元,只选用了“b、c、d、f、g、h、j、k、l、m、n、p、q、r、s、t、v、w、x、y、z”21个辅音字母做代码。
汉字的特点是字数多,音节少,存在大量同音字。总计412个音节中,同音字在20个以上的音节有140个。“yi”、“ji”两个音节的同音字多达110个。那么,如何直观明显地将那些同音字加以区分呢?总结前人的经验,最有效、最为人们普遍使用的方法是偏旁部首区分法。比如《新华字典》、《现代汉语词典》的检字表,都采用的是偏旁部首检字法。据此,如果把每个音节中的同音字,都按不同偏旁部首排列一遍,再给偏旁部首编上代码,直接缀在音节的后面,就可以得到一个编码,将这个编码依附在键盘上,就会形成一种汉字输入方法。这就是所谓的PJP汉字输入法的设计思想。
实现这一设计的方法是编制一个偏旁部首代码表。大家知道《新华字典》和《现代汉语词典》检字表中采用的基本相同,字典采用189部,词典采用了188部。作者考虑到普及性的要求,从它们中选用了187部,基本保持了原样。根据汉字在187部、412音节矩阵中的分布情况,经过多次模拟实验和统计分析,将187部按使每个音节中对同音字区分率达到最大的要求,把它们分成了21组,每组用一个辅音字母代表。形成了附
图1中所列的PJP偏旁部首代码表,它基本上满足了区分同音字的要求。
PJP码共有三种形式1.原音节;2.音节加一个偏旁部首代码;3.音节加两个偏旁部首代码。音节后面的两个偏旁部首代码依次叫做一位码和二位码。
PJP选偏旁部首的原则是一位码取大优先,二位码取其末部。“取大优先”的含义有三点1.按汉字结构取其中所占比例大的偏旁部首;2.有几个偏旁部首可取时,取其中使用频率大的偏旁部首;3.按编码自身区分同音字的要求,取其中同其它字区分率大的偏旁部首。二位码是为区分同音节中偏旁部首相同或偏旁部首代码相同的字而增加的。一位码确定以后,如果对应的汉字不是唯一的,再取其所剩部分的末部,构成二位码加以区分。
编码的可行性还在于它有一个非常广阔的区域。根据编码的三种形式,决定有19万多个编码。第一种原音节形式,共有412个编码,主要用来处理无法确定偏旁部首的字,或代表该音节的高频字(最常用字);第二种形式音节加一位码,共有(412×21)8652个编码,这个数已经超过了一、二级字库的汉字总数(6763个)。前面说过同音字在20个以上的音节有140个,20个以下的音节有270多个,占多数,所以编码主要集中在这一范围内,是PJP编码的基本形式;第三种形式音节加两位代码,共有(8652×21)181692个编码,主要区分同音字中一位码相同的字。实际应用中采用二位码形式处理的字约占总字数的1/3左右。三种形式总计有19万多个编码,在这样广阔的区域内汉字编码的自由度很大,所以PJP没有一个重码。
PJP的输入过程是首先将汉字的拼音键入,而后按输入汉字所属偏旁部首键入其代码。
PJP码实质上是一种区位码。一个音节就是一个区。每个区内由21个一位码排21行,22个二位码(其中有二位码为零时的一列)排22列。共有21×22位置,可容纳462个汉字。事实上每个区都不会被容满,即是对110字的“yi”“ji”音节也是非常阔绰的。象附图3所列的。
PJP每个区内汉字排列遵循以下规律一位码相同的字,即偏旁部首相同或偏旁部首代码相同的字,排在同一行;二位码相同的字,即一般为取过一次偏旁部首后剩余部分相同的字,排在同一列。完全同人们初识汉字时辩别字形的方法一致,有益于使用者加深对汉字结构的理解和认识。
为了充分体现这一特点,PJP输入法采用的提示方式如下1.揭示窗一次提示22列,即提示原音节和二位码为零时,所有一位码形式的汉字。并指示出该音节一位码相同的字数(用“还有”)。如键入音节fang以后的提示是
当要输入的汉字有两位代码时,先键入拼音,再键入一位码,最后键入二位码。相应的提示变化形式是以输入“坊”为例。坊的PJP代码是fangtz,键入拼音fang,提示如前,键入一位码“t”提示是
这时按空格键,输入“访”字;按Z键输入“坊”字。
另外,对有些字,确定其二位码比确定其一位码更明显。为了便于查找,PJP设置了一个一位码未定义键“
”。按此键表示一位码还未确定。这时再按二位码,提示行提示该音节所有二位码相同的字。如1.fang+
+z(二位码)提示
这时再按键确定的是一位码。
以上各种提示,使得不论一位码、二位码,只要确定了其中的一个,即可以查到未知的另一个。既方便使用,免去了操作者死记硬背之苦,使输入方法易学、易用便于普及。同时使输入更加方便,不拘拟于“规则”、“代码表”的局限,增加了编码的自由度,为消除重码,减少二位码提供了条件。比如在一些音节中,一位码21行中还有许多空位,而一些高频字按严格的编码规则,则要编成二位码,这对输入很不方便。这时,由于提示的作用,我们可以离开规则,在“合乎情理”能被人们所接受的前提下,把这些字变成一位码输入,从而使输入更加简炼。
为了提高输入速度,减少拼音中“ang、eng、ing、ong”等一些常韵母的击键次数,PJP设计了12个韵母键来解决这一问题。具体方法是,从“1-0”以及“-”“=”12个键依次代表“ai、an、ang、ao、enging、ong、en、ei、in、un、uo”12个韵母。这一方法可使拼音击键次数减少1/3。如“zhuang”由6键击入,变为4键击入。
需要说明一点,按12个韵母键,同按字母键是等效的。如按“ang”同按“a”、“n”、“g”结果都一样。提示窗一律显示“ang”。具体用那一种方法操作者可以自选。
本发明同现有技术拼音输入法相比较,无论全拼、双拼都没有解决重码问题。看提示按数字键选择汉字,有两大缺点1.操作者处于被动状态,非看清楚不能确定所要的字,即使使用时间很长,能记住所在页数、键号的汉字很少;2.击键次数太多。在这方面双拼比全拼进步了许多,但同样没有摆脱缺点1的制约,同时还较大地增加了输入难度。尽管如此据有关资料介绍,使用拼音输入法的人在70%以上。这说明拼音输入法亟待改进。
PJP同拼音输入法相比,较好地克服了以上两个缺点。首先PJP使击键次数减少。具体方法是1.增加了提示,由10列变成22列;2.保证每个字音节后最多只击两键,不必翻页;3.设置了12个韵母键,减少了原音节的击键次数约1/3,而加上代码以后增加的击键次数还不足1/3。更重要的是PJP输入法使操作者变被动为主动,无论是先记会了代码表(实际应用中记会前四行就行了)去操作,还是看提示去操作,PJP都会使他在不长的时间内,形成偏旁部首和代码之间的对应联系,完全可以离开提示,主动地按汉字所属偏旁部首去按代码键。不仅提高了输入速度,还为“想打”奠定了基础。因此,不难得出结论,PJP与拼音输入是完全不同的,PJP优于拼音输入。
本发明同拼形输入法相比较,由于两种输入法相差较大,比较较难,但从功能上相比,拼形输入的优点是读不出音的字也可以键入,不受方言的限制。但同时由于语音无关,不宜“想打”,缺点是字根生僻难记,普及性差。而PJP则在“想打”和普及性方面有明显的优点。一般操作者看说明书即可上机操作。
同音形码相比,由于近年来音形码发展较快,形式也很多,这里只着重同“快速码”相比。
快速码是以“首尾码”为基础,再辅以拼音。“首尾码”选取了汉字字形的左上角和右下角,只取53种字根。从取码角度看,左上角取1,右下角取1,要取两码,可谓多矣;从取部件的角度看,只取53种,可谓少矣,而取码虽多却又没有抓住区分汉字的特征,所以重码很多。后面的拼音是为了区分重码而加上的,可谓本末倒置,没有抓住汉字的本质。
汉字中形声字最多,由一个表声部分,同几个不同形式的表意部分(一般是偏旁部首)搭配构成。比如在fang这个音节中有方、仿、妨、舫、彷、纺、放等字,它们共同的特征是同音,异同处的本质在于偏旁部首不同。由于辅于各种不同的偏旁部首引起了它们各字形式上可以相互区分,从而又使所表达的意思也有了区分。每一种偏旁部首将我们的联想带到一个特定的意类中去,所以汉字单凭语音还无法确定它所表达的意思。一定要看了汉字才能真正懂得语意。听不懂的古诗一看就明白,现在虽然汉字的双音节词汇增多了,但是只看拼音还是不能明意,其中的道理也就在这里。因为听者不知道该把听到的语音放在那一个意类全联想,无法确切地领会完全的语意。部首的作用就是从形式上区分汉字,并把听者的联想领入到特定的意类中去,也就是说偏旁部首就专门用来区分字形、字意的东西。由于抓住了这个本质的东西,PJP在设计上以拼音为共同特征,辅以187个偏旁部首以21个代码区分之,做到了结构合理,输入简捷。所以说PJP同快速码有本质上的区别。另外,快速码使用了双拼,对学习者增加了负担,PJP则用12个韵母键更显得快捷。
PJP的特征在于编码非常“亲近”汉字,它介于汉字和拼音之间,并把二者紧密地联系起来,既保留了拼音的注音作用,又反映了汉字形体特征。大部分汉字都是形声结构PJP亦是拟形声结构这一方法而成的。可以说PJP是按音、形、意全方位去“贴近”汉字的,所以作者把以上特点称作编码对汉字的“亲近”性,即音近、形近、意近,从三方面,模拟汉字同汉字“近似”。
作者的本意在于创造种一种最富有表现汉字特点,既简单又方便的输入方法,从而使汉字更方便地被人们所应用,特别是想把作家、记者和从事文字写作工作的人们从爬格子改成“按键子”免去手写拟稿和誉写稿件之苦。作者认为多年来400多种编码没有令人叹服地解决好汉字输入这一问题的原因,就在于没有从“亲近”汉字这一方向去努力,PJP输入法仅仅是在“亲近”说指导下的开端,但愿它能被人们接受。
综上所述,“PJP”是一种新型输入方法,它综合了区位码、音码和形码的长处,具有以下几方面的优点1、在方法上,使拼音输入和拼形输入“互补”相得益章,具体体现以下两点(1)选用21个辅音字母做代码,保证了拼音音节不被破坏;(2)设计了《偏旁部首代码表》,用偏旁部首表明汉字的形意特征,要求知识背景浅,极易被人们所接受,具备很好的普及性。
2、应用区位码的原理,使同音字排列严谨,有规律,符合人们的识字心理,易于学习使用。
3、采取了提示选字的形式,无需死记硬背,大大减轻了操作者的学习负担。
4、编码和语音一致,符合人的思维过程,操作熟练期短,并可进入“想打”。
5、PJP输入法不仅仅汉字适用,而且对词同样适用。一个词不论它由几人字组成,只在最末一个字按PJP输入,以前所有的字都按拼音输入或按声母输入即可。
6、PJP码介于汉字和拼音之间,并把二者紧密地联系起来,它比拼音更贴近汉字,即保留了拼音的注音作用,又反映了汉字的结构和形意特征。它不仅仅作为一种输入编码,还可以用于字典、词典检索、民用电码,在识字教学、“推普工作”等方面也将起到桥梁作用。
图2是一个标准键盘(部分),第一行中“1、2、3、4、5、6、7、8、9、0、-、=”是原键名称,“ai、an、ang、ao、eng、ing、ong、ei、en、in、un、ou”是PJP输入状态下作为韵母键时,该键所代表的韵母。第二、三、四行,上边的大写是原键名称,下边的小写是PJP输入状态下,作为偏旁部首代码键时该键所代表的代码。从图2可以看出PJP的代码键同原键名称完全一致。
图1是偏旁部首代码表在实际应用中应注意1、当n遇到a、e、u时,为了避免同an、en、un混淆,改用h代替。2、当an、en、in遇到g时,为了避免同ang、eng、ing、ong相混淆用y代替。3、v代表左阝部,f代表右阝部,有时通用,同样,文和攵、礻和衤、日和曰、士和土,有时也通用。
权利要求
1.PJP汉字输入法是一种将字典辞典偏旁部首检字法在微机上应用的方法,其特征在于用汉字偏旁部首代码将每个音节中的同音字全部区分开来。
2.按权利要求1所述的输入法,其特征在于把所有的汉字分布在由187个偏旁部首和412个音节所形成的矩阵中,按照使每个音节中同音字区分率达到最大的要求,将187个偏旁部首分成21组,每组用一个辅音字母作为它们的代码,如附图(1)所说明的。
3.按权利要求2所述的输入法,其特征在于把汉字的拼音和偏旁部首代码一起输入,并把每个音节里所有的同音字分布在由21个一位码和22个二位码形成的矩阵区内,采用22列提示,随动显示同音字在区内任意一行(或列)上的分布情况。
4.按权利要求3所述的输入法,其特征在于把21个代码和汉语拼音方案中的12个韵母分别定义在33个键位上,如附图(2)所说明的。
5.按权利要求1所述的输入法,其特征在于没有那两个汉字的输入方法是相同的,即无重码。开创性地将所有汉字按拼音顺序(不分调质)排成一长列,可用于字典和词典检索。
全文摘要
PJP是为非专业录入人员提供的普及型一种汉字输入方法。其特点在于用21个偏旁部首代码将所有的同音字全部区分开来,学习和使用极其简便。象查字典那样,只要选准汉字的偏旁部首,把它的代码加在后面一起键入即可。PJP配有22列随动提示,使录入工作非常轻松方便。PJP码非常“贴近”汉字,它介于拼音和汉字之间,并把二者紧密地联系起来。
文档编号G06F3/023GK1060725SQ90108479
公开日1992年4月29日 申请日期1990年10月12日 优先权日1990年10月12日
发明者杜健 申请人:杜健