一种计算机输入系统——汉字兼容码的利记博彩app

文档序号:6598325阅读:1351来源:国知局
专利名称:一种计算机输入系统——汉字兼容码的利记博彩app
技术领域
本发明属于汉字计算机输入系统,具体涉及一种音形兼容的汉字编码。
最近报载,计算机将成为中小学基础课,和语文、数学、外语一样,是青少年必须掌握的五个基本工具之一。国家教委已正式立项,把全国中小学教学用汉字编码规范及计算机输入系统列为重点攻关项目。
纵观目前国内外数百种汉字输入方案,可以归纳为二大类,一类是拼音输入法,一类是字形输入法。拼音输入法虽然方便易学,但由于汉字中同音字太多造成大量重码,严重影响了输入速度。况且我国方言繁杂,不少人会写会用却读不准音,让这些人来使用拼音输入法,必然会一筹莫展。
字形输入法的设计者大多将汉字分成许多个字根,然后分别给其贴上标签。这样做难免要添加一些规则,生造一些字根,违背了汉字演化规律和结构规律,而且这么多的标签需要强记硬背,让人望而生畏。特别是广大的科技工作者、作家学者、编辑记者、教师和学生,他们仅把汉字输入作为一种工具来使用,不可能要求他们强记这么多条条框框。正如众多学者所要求,必须找到一种真正易学好用的汉字输入方法,使得无论是专职输入员还是专家学者,都可以轻松输快地学习掌握。只有这样,计算机在我国的应用才可能得到真正的普及。
本发明的目的在于将表音表形有机地结合起来,强化了表音码简易便捷,表形码快速准确的优点,努力克服两者固有的缺陷,尽可能地减少输入规则,减少记忆负担,特别注重实用性、普及性和规范化,从而提供一种便于学习掌握、适宜于在中小学推广使用的计算机输入系统汉字编码。
本发明的目的是这样实现的一、汉字兼容码为计算机输入系统汉字编码之一种。单字输入和词汇输入均四码取字。码符由26个拉丁字母组成。采用国际标准键盘。
二、一个汉字一般代表一个音节,大部分音节由声母和韵母构成。现代汉语没有复辅音,音节的结构整齐,界线分明。本方案第Ⅰ、Ⅱ两码为表音码,即代表该汉字的音节。
三、汉字兼容码第Ⅰ码代表该汉字的声母。
共使用20键(其中A,E,I,O,U,V六键不用)。声母b,p,m,f,d,t,n,l,g,k,h,j,q,x,r分别用相应的键位作代码,z,zh合用Z码,c,ch合用C码,s,sh合用S码,半元音w,y亦分别用对应的键位作代码。
在我国,有半数以上的方言(如吴语、闽语、粤语、客家语等),对舌尖前音z,c,s和舌尖后音zh,ch,sh分不清楚,甚至不分。这些地方的人,在学习普通话时很难辨别和掌握。为此,我们将两者并在一起,解决了这一难题,使他们都能得心应手地上机操作。
四、汉字兼容码第Ⅱ码代表该汉字的韵母。
共使用13键(A,B,C,E,F,I,K,M,N,O,U,V,W)。
中国地大人多,方言也多,有些方言的韵母跟普通话韵母不甚相同。
汉语中的鼻韵母颇具特色,它由元音和鼻辅音韵尾构成。在鼻韵母中又分带舌尖鼻音n和带舌根鼻音ng两类。对大部分中国人来说,分不清n,ng是一大通病,但对鼻韵母却还是很敏感的。
为此,汉字兼容码先把35个韵母按头韵分成五大类,再将各类中的鼻韵母分列开来,并参照各韵母出现频率的高低归成十三类,各设代码如下
这一分类法是按照汉语发音规律,进行切块组合,故符合规范。而且采用模糊分类的办法,既可回避使用者因发音不准而出错,而且又能通过多渠道的分流,降低重码概率,故切实可行。
本方案韵母代码表需加记忆,但由于它是遵循“先单韵母,次复韵母,后鼻韵母”的规律,故掌握起来并不费劲。
第Ⅰ、Ⅱ码取码举例如下亚(ya)→YA沈(shen)→SF将(jiang)→JM虹(hong)→HO注汉字中有少数零声母音节,第Ⅰ码取X。如爱(ai)→XB欧(ou)→XO鹅(e)→XE五、汉字由各种字根组成,其中一些出现频率较高、结构较稳定的字根演化成部首,大部分汉字都包含一两个甚至多个部首。因而从部首入手,便能较全面较完整地剖析该汉字的结构特征,收到以简驭繁的效果。本汉字兼容码第Ⅲ、Ⅳ码为表形码,即代表该汉字的部首、偏旁或字根。
汉字兼容码以《现代汉语词典》、《新华字典》为模本,共分188个部首,每个部首设定一个代码,设定原则如下(一)凡部首本身是汉字的,以该汉字的声母为代码。如王--W角--J小--X竹--Z土--T山--S(二)凡部首是从某字演变过来的,以该字的声母为代码。如钅-金-J忄-心-X犭-犬-Q饣-食-S衤-衣-Y礻-示-S(三)凡部首系某汉字的偏旁冠盖,以该汉字的声母为代码。如宀(宝盖头)--宝--B亠(文字头)--文--W疒(病壳儿)--病--B辶(走之旁)--之--Z(四)一些较大的部首,专门设定代码,需记忆。
(五)部首代码总表一画一横H丨竖S丿撇P丶(
) 点(捺) D 乙(乛刁)折 O二画亠 (文字头)W冫 (两点水)I冖 (平宝盖)B讠 (言字旁)Y二 erE十 shiS厂 chan C 匚 (区字框) Q 卜(
) bu B刂 (立刀旁)D冂 (同字框)K八(丷)baB人(入)R亻 (单立人)R勹 (包字头)B儿 E 几(
) (风字壳) F 厶 si S又(
) Y 廴 (建字旁) J 卩 ()(单耳朵) P阝 (左)(左耳朵)P阝(右)(右耳朵)P凵 (凶字框)K刀() daoD力 liL三画氵 (三点水)I忄 ()(竖心旁)X宀 (宝盖头)B丬 (爿)(壮字旁)Z广 (广字头)G门 menM辶 (走之旁)Z工 gongG土 tuT士 shiS艹 (草字头)O大 daD廾(在下) gongG尢 youY寸 cunC弋 yiY扌 (提手旁)U小() xiaoX口 kouK囗 (围字围)W巾 jinJ山 shanS彳 chiC彡 (三撇儿)S夕 xiX夂 (条字头)T犭 (反犬旁)Q饣(食字旁) S 彐 (
)(灵字头) L 尸 shi S己(巳) jiJ弓 gongG屮 cheC女 nuN幺 yaoY子(孑) ziZ纟(糸)A马 maM巛 (川字头)C四画灬 (四点水)I斗 douD文 wenW方 fangF火 huoH心 xinX户 huH礻 (示字旁)S王 wangW韦 weiW木 muV犬 quanQ歹 daiD车 cheC戈 geG比 biB瓦 waW止 zhiZ攴 puP日A曰 yueY贝 beiB见J父 fuF牛 niuN手U毛 maoM
气 qiQ夊 (反文旁)F片 pianP斤 jin J 爪 zhao Z 月(
) yue L欠 qianQ风 fengF殳 shuS肀(
聿) Y 母 (毋)mu M 水 I五画穴 xueX立 liL疒 (病字壳)B衤 (衣字旁)Y石 shiQ龙 longL业 yeY目 muM田 tianT罒 (横目儿)M皿 minM钅(金) jinJ矢 shiS禾 heH白 baiB瓜 guaG鸟 niaoN用 yongY矛 maoM疋() piP皮 piP六画衣 yi Y 羊(
羊) yang Y 米 mi M耒 leiL老 laoL耳 erE臣 chenC西 xiX页 yeY虍 huH虫 chongC缶 fouF舌 sheS竹() zhuZ臼 jiuJ自 ziZ血 xueX舟 zhouZ羽 yu Y 艮(
) gen G七画辛 xinX麦 maiM走 zouZ赤 chiC豆 douD酉 youY辰 chenC豕 (古猪字)Z卤 luL里 liL足() zuZ豸 zhiZ谷 guG采 bianB身 shenS角 jiaoJ八画青Q其qiQ雨 yuY齿 chiC黾 mengM隹 zhuiZ鱼 yuY九画音 yinY革 geG骨 guG鬼 guiG十画以上門 douD髟 biaoB麻 maM鹿 luL黑 heH鼠 shuS鼻 biB注划线的代码需稍加记忆。
(六)部首代码索引A日纟(糸)B冖卜八宀比贝疒白采髟鼻C厂寸彳屮巛车臣虫赤辰齿D丶(点)刂刀(ク)大斗歹豆E二儿耳F方父攵几(几)风缶G广工廾弓戈瓜艮谷革骨鬼H 一(横)火户禾
黑I冫氵灬水J廴巾已见斤钅(金)臼角K冂凵口L力彐月立龙耒老卤里鹿M门马毛母目罒皿矛米麦黾麻N女牛鸟O乙(折)艹P丿(撇)卩()阝(左)阝(右)攴片疋皮Q匚犭犬气欠石青其R亻人S丨(竖)十厶士山彡饣尸礻示殳矢舌身鼠T土夂田U扌手V木W口亠文王韦瓦X忄小夕心穴西血辛Y讠又尢幺曰肀衤业用衣羊页羽酉雨鱼音Z丬辶子止爪竹自舟走足豸豕隹六、汉字结构复杂,根据字形可分为合体字和独体字(亦称单体字、聚体字)。合体字又分左右结构、上下结构、内外结构。
(一)合体字取码1.该汉字如为左右结构,则从左右部分各取一独立的部首代码作Ⅲ、Ⅳ码。分体部分如有两个或两个以上部首,按先上后下、先复笔后单笔、先远后近的原则取码,如没有部首,按起笔笔形取码。如(1)左右各取一部首虹→虫+工HOCG吐→口+土TUKT(2)先取上后取下辑→车+口JICK部→立+阝BULP(3)先取复笔后取单笔粮→米+艮LMMG仟→亻+十QMRS(4)如无独立部首取起笔卵→丿+卩LYPP死→歹+丿SIDP(5)先取远后取近树→木+寸SUVC膨→月+彡PELS2.该汉字如为上下分体结构,则从上下部分各取一部首代码作Ⅲ、Ⅳ码。分体部分如有两个或两个以上部首,按先左后右、先复笔后单笔、先远后近的原则取码,如没有部首,按起笔笔形取码。如(1)上下各取一部首泉→白+水QYBI章→音+十ZCYS(2)先取左后取右资→冫+贝ZIBB落→艹+氵LWOI(3)先取复笔后取单笔奏→大+大ZODD坚→又+土JMYT(4)如无独立部首取起笔宁→宀+一NNBH誉→丶+言YUDY(5)先取远后取近复→丿+夂FUPT总→八+心ZOBX(二)独体字取码1.该汉字如为独体字,取该字的部首为第Ⅲ码,取另一辅助部首或分立的部首为第Ⅳ码。如巫→工+人WUGR吏→一+口LIKH2.该汉字的部首被第Ⅲ码取后,剩余部分如找不出部首,则取起笔作第Ⅳ码。如牙→一+乙YAHO央→大+丨YCDS
3.该汉字如刚好为一部首,则从中找一笔划最多的部首作第Ⅳ码,如找不出则以起笔作第Ⅳ码。如角→角+用JKJY音→音+立YNYL力→力+刁LILO心→心+丶XNXD汉字是表意体系的文字,不是直接表示音位或音节,而是用表意符号来记录词汇和语素。汉字虽属于象形字,但从几千年的演化过程中可以看出,汉字的构造正由表意向表音发展。形声字大量增加,已成为汉字发展的主流。据统计,在现代汉字中,形声字已占到80%以上。形声字中含有形符,也含有声符。人们在交谈说话时离不开发声,即使在阅读写字时哪怕嘴巴没有出声,心中却在默诵,这是因为听觉形象和视觉形象是相辅相成的。因此在研究分析汉字时,不能仅停留在汉字的形体结构分析上,更重要的是要注意汉字形符与声符的形态结构,从中找出规律来。汉字兼容码中两个表形码正是掇取汉字中的两个偏旁部首(即形符与声符),并以其偏旁部首的发音来归类的。可以说,汉字兼容码音形兼取,侧重在音。
七、词汇编码(一)双字词先分别取两个单字的声母码作第Ⅰ、Ⅱ码,再分别取两个单字的部首码作Ⅲ、Ⅳ码,如机器JQVK经济JJAI(二)三字词分别取三个单字的声母码作Ⅰ、Ⅱ、Ⅲ码,第Ⅳ码一律用U,如计算机JSJU解放军JFJU(三)四字词各取每字声母码,依次排列,如汉字编码HZBM温州日报WZRB(四)多字词取第一、第二、第三及最未一字的声母码依次排列,如电子计算机DZJJ中华人民共和国ZHRG任何一种汉字输入方案,一般都针对汉字而言,然而严格来说,汉语词组输入方案,也是不可忽视的重要组成部分。判断一种方案的优劣,主要看其能否做到易学易记,快速准确,同样,词组输入能否做到便捷准确也是评测的重要标准之一。词组编码会不会跟汉字编码出现重码?各类词组间会不会出现重码?这都是非常重要的问题。
汉字兼容码的最大优点之一是,汉字编码和词组编码共存共容,互不干涉,不会混淆。这是因为(一)汉字编码的第Ⅱ码为韵母码,而词组编码的第Ⅱ码为第二字的声母码。韵母码和声母码两者泾渭分明,各行其道,不会出现合流。
(二)二字词汇的第Ⅳ码为第二字的部首码,几乎不出现代码U,而三字词汇的第Ⅳ码设定为代码U,这样就避开了重码的可能。
(三)二字词汇的Ⅲ、Ⅳ码为表形码;四字词汇及多字词汇的Ⅲ、Ⅳ码为表音码,由于两种类型的代码实质组合不同,故出现重合的概率极低。
词汇码的输入和单字码的输入可混合进行,不需任何切换。在输入过程中,尽量输入词汇以求其快,如逢个别专业或生僻词汇则输入单字以求其准。
六、检索键码(一)音码检索键V当你对某汉字的读音没有把握时,可以用V键来检索。例如“检”字声母为j,韵母为ian。代码应为JMVR。如你不知它的声母,则键入VMVR,此时显示屏的提示行里就会出现“检”字及它的代码JVVR。这样既可检索到所输的汉字,又可领会取码的要领,学习到编码知识。如果你不知它的韵母,则键JVVR即可。
(二)形码检索键?当你对某汉字的部首或辅助部首确定感到困难时,可以用?键来检索。如“检”字为左右二分体结构,其部首应取木、人,其代码为JMVR,如你键入JM?R或JMV?,提示行里同样可出现“检”字。
综上所述,本发明体现了“快准全”的设计思想。所谓快就是让大家能很快熟悉,很快掌握,很快上机;所谓准,就是严格符合汉语规范,符合演化规律;所谓全就是能适应不同层次不同素质的人员使用,既考虑电脑应用的普及化和大众化,又考虑电脑工作者使用的专业化;既考虑输入时减化程序提高速度,又考虑输入的准确性。
本发明具有以下五个优点一、易学易用。凡是掌握汉语拼音基本知识,具备部首检字基本知识的人都能一学就会,立即上机。
二、合乎规范。任何一条规则都符合汉字规律,均有据可依,有本可查。特别适合于标准化教学,适宜在中小学推广使用,并能引导学生正确书写汉字,增加汉字知识。
三、普及型、专业型功能兼具,各种人员使用皆宜。
四、单字编码与词汇编码可以共存共容,而且词汇编码容量大,可使中文输入技术向“以词为主,以字为辅”的方向发展,大大加快了输入速度,提高了工作效率。
五、适用于繁体字。只需重新设置部首代码,即可用于繁体字输入,故亦可适用于港台地区。
权利要求
1.一种计算机输入系统汉字兼容码,其特征在于表音表形兼容,以汉字的音形取码,四码取字,以26个拉丁字母作代码,采用国际标准键盘。
2.根据权利要求一所述的汉字兼容码,其特征在于Ⅰ、Ⅱ两码为表音码,分别代表该汉字的声母和韵母,Ⅲ、Ⅳ两码为表形码,分别代表该汉字的形符和声符(偏旁部首)。
3.根据权利要求一、二所述的汉字兼容码,其特征在于声母码中,将舌尖前音z,c,s和舌尖后音zh,ch,sh合用代码,零声母用代码X。
4.根据权利要求一、二所述的汉字兼容码,其特征在于韵母码中,先把35个韵母按头韵a,e,i,o,u分成五大类,再将各类中的鼻韵母分列开来,并参照各韵母出现频率的高低分成十三类,按汉语发音规律进行切块组合。
5.根据权利要求一、二所述的汉字兼容码,其特征在于Ⅲ、Ⅳ两码分取汉字中的两个偏旁,取码方法规定如下左右结构合体字左右各取一部首;上下结构合体字上下各取一部首;包围结构合体字Ⅲ码取包围部分,Ⅳ码取中间部分;独体字Ⅲ码取部首,Ⅳ码取辅助部首或起笔。
6.根据权利要求一、二、五所述的汉字兼容码,其特征在于凡分体结构的汉字,Ⅲ、Ⅳ两码均按先左后右,先上后下,先远后近,先复笔后单笔的原则取码。
7.根据权利要求一、二、五、六所述的汉字兼容码,其特征在于部首设置以《现代汉语词典》为模本,以部首读音声母或习惯称呼声母为代码,个别部首给予拟定代码。
8.根据权利要求一至七所述的汉字兼容码,其特征在于单字编码为汉字声母+汉字韵母+汉字部首+汉字辅助部首;二字词组编码为第一字声母+第二字声母+第一字部首+第二字部首。
9.根据权利要求一至八所述的汉字兼容码,其特征在于分设音码检索键Ⅴ和形码检索键?。
全文摘要
本发明系一种计算机输入系统汉字兼容码,它吸取纯形码与纯音码之所长,克服两者各自固有的缺陷。两音码各取汉字的声、韵母、采用切块组合,模糊归类,有利于方言区人员使用;两形码各取汉字的声符与形符,严格遵从汉字构字规律,合乎汉语规范,且易学易记,尤适宜于非专业人员使用,可在中小学推广。汉字兼容码的单字编码与词组编码能共存共容,以词为主,以字为辅,从而大大提高了输入效率。
文档编号G06F3/023GK1085670SQ9211160
公开日1994年4月20日 申请日期1992年10月11日 优先权日1992年10月11日
发明者沈迦, 沈克成 申请人:沈迦, 沈克成
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1