汉字部首规范码及键盘输入的利记博彩app

文档序号:6355396阅读:628来源:国知局
专利名称:汉字部首规范码及键盘输入的利记博彩app
技术领域
本发明涉及一种汉字编码方法,用于计算机键盘输入汉字。
使用通用英文键盘输入汉字,是用计算机处理中文信息的重要手段之一。这是通过对汉字编码来实现的。已公布了数百种编码方案。主要分为音码和形码两类方案。音码方案利用拼音进行编码,容易学习,但重码率高,选字操作限制了输入速度。汉字发音的方言差异也影响了音码方案的通用性。形码方案利用汉字字形进行编码,重码率低,输入速度快。该类方案需要学习用于汉字编码的部件和编码规则,而这往往与国民教育背景中有关的汉字知识不吻合,难学易忘。五笔字形输入法是一种较典型的形码。该法编码部件和编码规则与所学汉字知识差别较大,需要反复练习方可掌握。在中国发明专利公开号CN1154502中,发明人对原设计作了局部改进,但规范程度仍未根本改观。郑码是目前计算机视窗操作系统中予装的一种形码输入法,见中国专利公开号CN1043210。该法虽使用了相当数量部首,但将其划为主根、副根及引入区码、位码概念进行编码,与传统意义的汉字部首和汉字结构概念并不一致。中国专利公开号CN1223396发明了一种部首输入法。该方法规定一律按先部首、后字身顺序编码,往往与书写习惯不一致,另外该方法部首二码、字身一码的编码方法使得对大多数汉字需要进行选字操作,输入速度受到限制。
减轻形码学习难度的有效途径之一是尽量利用国民教育背景知识,提高编码的规范性。这些知识主要有汉字部首、汉字字形结构、汉字笔画顺序等。形码输入方法不仅应易于被已识字者掌握,也应可以被在校学生在识字过程中同步学习。与所学汉字知识尽量保持兼容性,才能达到易学不易忘的目的。
本发明正是基于上述任务而提出的一种兼容了国民教育背景的汉字形码输入法。本发明将所有汉字部首按易于辨认的笔形特点分类,直观易记。不仅利用部首对汉字的分类和结构上的引领作用,也将部首本身作为编码部件使用。在编码规则上按照汉字本身的主流结构“形声”进行切分,即对部首和声旁分别编码。用部首作为统一的编码部件,以及与汉字结构一致的规范编码,使本发明成为一种容易学习的汉字输入法。
本发明由编码部件、键位布置、编码规则三部分内容组成。以下是本发明详细说明。
编码部件由汉字部首组成。部首按笔形特怔分类后布置在键位上。简体字和繁体字部首统一分类。以下每行结尾字母为该类部首所在键位。每个键位分配一至二类部首。横起笔的类别一类,一王玉鬥鬲雨比歹牙旡 无 F镸类,镸長馬髟 F二类,二示亚亞豆干車耳 D厂类,厂辰石豕而页頁面 D艹类,艹 廾 廿甘其革黄 S兀类,兀西酉 S土类,土士工 老走赤鼓麦青 A十类,十支 G大类,大犬Tナ类,ナ尢龙韦寸扌弋戈戊车 N寸类,寸扌弋戈戊车 N木类,木麥耒 M匚类,匚臣瓦至 M竖起笔的类别丨类,丨卜攴虎止齿卤齒鹵 J虫类,虫 J刂类,刂业黹非韭 K口类,口田黑曰罒目鼎見貝 K口类,口黾邑足 L山类,山 Y
日类,日里 Y冂类,冂皿肉禸巾骨冃黽贝见 B撇起笔的类别丿类,丿豸片爫 儿入匕舌长氏夂钅R 类, 爪斤瓜戶 R人类,人食飠 金龠舍E几类,几殳风風 E彳类,彳彡 W类,色饣鱼魚夕舛角欠勹鸟 W禾类,禾采黍香手毛 Q类,攵气缶矢牜 牛生 T自类,自白血臼鳥鼠鼻鬼身舟龜 V亻类,亻隹 C爻类,爻丸犭 X月类,月用 B点起笔的类别丶类,丶宀冖忄户穴门礻 U冫类,冫斗丬丷 羊米父谷首八 I氵类,氵心 O灬类,灬火P亠类,亠玄文音言齊辛立龍 方高衣衤齐 H乀类,乀 H广类,广疒麻鹿辶讠 G折起笔的类别肀类,肀 聿隶彐艮門廴又 O乛类,乛子孑癶 疋矛马弓己巳已民尸 P 类, 刀羽卩阝V亅类,亅小 水 C女类,女母毋 力 皮 X乚类,乚彑凵中艸巛爿纟 Z乙类,乙飞飛○ Z厶类,厶幺 糸 Q分类部首在键盘的布置见

图1。部首“衤”和“无”未按笔形归类于丶和二类,而是按词源归类于同源部首衣”和“旡 ”的亠和一类。
为减少重码,将同类部首分为单码部首和双码部首。将以下这些部首作为双码部首使用。横起笔画有一类,鬥鬲歹牙旡 镸类,馬髟二类,亚亞豆干車耳厂类,辰而頁面艹类,甘其革黄兀类,酉土类,老走赤鼓麦青十类,支 ナ类,龙韦车木类,麥耒匚类,至竖起笔画有丨类,虎齿卤齒鹵刂类,黹非口类,田黑目鼎貝口类,黾邑山类,山(左)日类,日(左)冂类,巾骨贝撇起笔画有丿类,豸片舌氏夂 类,爪瓜戶人类,飠龠舍几类,风風类,饣鱼夕舛角禾类,禾(左)采黍香类,气缶矢牜白类,鼠鼻鬼身舟亻类,隹爻类,犭点起笔画有丶类,穴门礻冫类,丬 羊米父谷首灬类, 亠类,玄文音齊龍 方高衤齐广类,疒麻鹿折起笔画有肀类,聿隶彐艮門乛类, 疋矛马 类,羽女类,力 皮乚类,爿单、双部首在键位上的分布见图2。双码部首先取该部首后取第二部件作为第二码。如革为革、口,山为山、凵,力为力、丿。
部首有时需要拆分。部首单独成字时,先取该部首,再从第二部件开始,取二、三、末码,不足四码用空格键结束。如部首赤的取码为赤、丿、亅、八,部首母为母、 丶、丶,部首木为木、丿、乀,部首尸为尸、一、丿,仅为两码时加末笔画,如部首山的取码为山、凵、丨,部首力的取码为力、丿、丿。有四个部首不拆,重复取四码,它们是日、月、目、口,单笔画部首也重复取四码,如日的取码为日、日、日、日,口的取码为口、口、口、口,乙的取码为乙、乙、乙、乙。作为双码部首时日和目也重复取两码,如明字取码为日、日、月。另一种需要拆分的情况是声旁为单一部首组成,这时依编码规则按首、二、末或首、末拆分。
单个汉字编码时分别对汉字部首和声旁取部首码和声旁码。“声旁”在现代汉字中并不能起完备的表声作用,但在形式上仍作为相对于“部首”的“声旁”结构,本发明也按此广义使用“声旁”这一术语。按书写顺序,部首在前先取部首码后取声旁码,声旁在前先取声旁码后取部首码。单码部首取首码,双码部首取首、二码,声旁依次取首、二、末码。例如,属部首扌的挽字,先取部首码为扌,后取声旁码为、口、乚;属部首力的勉字,先取声旁码为、口、乚,再取部首码为力;属部首灬的熟字,先取声旁码为亠、口、丸,再取部首码为灬。属双码部首米的粉字,先取部首码为米、木,再取声旁码为八、刀;属同一部首的粱字,先取声旁码氵、刀、八,再取部首码为米、木。不属形声结构的独体字按首、二、三、末取码。编码总长为五码。长度为两码长的字补加一末码。
总码长为四码可使编码简练,这对常用汉字集已有足够分辨率。单码部首的取码是相同的,即对单码部首的汉字,部首取一码,声旁取首、二、末码,如撇字取码为扌、丷、巾、攵,又如声旁在前的憋字,先取声旁的首、二、末码,再取部首一码丷、巾、攵、心。双码部首的取码规则是,若部首在前,先取部首的首、二码,再取声旁首、末码,如赠字,部首码取贝、人,声旁码取丷、日,若声旁在前,先取声旁的首、二、末码,部首仍取一码,如贸字取码,先取声旁码为丿、厶、刀,部首码取贝,即双码部首只有书写在先时才取两码,书写在后仍按单码取码。如属双码部首鱼的鲸字取鱼、田、亠、小,而鲨字则取氵、小、丿、鱼。
双码部首汉字若声旁为单个部首,声旁取该部首,字总码长为三码,如社字取码为礻、乛、土,稿字为禾、木、高。声旁土和高不拆。
如果部首和声旁均为单码,则会出现总码长为二的情况,这时需要将声旁拆分。左右结构汉字的声旁按首、二、末取三码,如搞字取码为扌、高、口、口,阳字取码为阝、日、日、日。对其它结构,补末码。如篙字取码为、高、口,斥字取码为斤、卜、丶,句字取码为勹、口、口,式字取码为弋、工、丶,本字取码为木、一、一,末字取码为木、一、乀,对属部首匚、囗的汉字不补字末码而补声旁末码匹取匚、儿、乚,国取囗、玉、丶。
双码部首中的日、山、禾仅在处于汉字左边时为双码,其它部位仍为单码部首。如晾的取码为日、日、亠、小,而景为日、亠、口、小,秋字取码为禾、木、火,而香为禾、日、日。
取码按最大原则,并允许两编码部件重复笔画,如毅的声旁取码为立、豕,不取亠、丷、豕,也不取立、丿、ㄟ。又如完的声旁取码为二、兀,不取二、儿,也不取一、兀。如果两编码部件的起笔相同,先取笔画多的,如扶的声旁取码为大、二,钱的声旁取码为戈、二。
与部首相近笔形结构归到该部首取码。这种归类仅作为取码部件而不是部首。多折笔画按最后一折归类,如专字取码为二、(乛)、丶,马字取码为马、( )、一,凹字取码为亅、(乙)、丨、一。多点的归类,如终字的取码为纟、夂、(冫),学的取码为(氵)、冖、子,雨字取码为雨、巾、(灬)。
对于汉字中出现的笔画交叉结构,本发明也提供了一种部首归类法,即将交叉结构归类到具有同一笔形特怔的分类部首。同以上一样,这种归类仅作为取码部件而不是部首。横起笔交叉的归到ナ类和艹类,撇和竖起笔交叉的归到爻类,折起笔交叉的归到女类、肀类和亅类。编码举例托的编码为扌、丿、(弋),挠的编码为扌、(戈)、兀,带的编码为(艹)、冖、巾,汹的编码为氵、(爻)、凵,仇的编码为亻、(丸)、乙,为的编码为丶、(犭)、丶,施的编码为方、 、(力),拨的编码为扌、(女)、又、丶,群的编码为(肀)、口、羊,捂的编码为扌、二、(犭)、口,字的编码为宀、乛、(亅),括号内部首为该交叉结构的归类码。交叉结构中若有部首取完归类码后再取该部首,如董字编码为艹、丿、(ナ)、里,邦字编码为(ナ)、二、阝,逢字编码为夂、(ナ)、二、辶。交叉结构中其它的相连笔画也归于该结构。不再另取码,如张字取码为弓、丿、(弋),舞字取码为、(廾)、舛,段字取码为丿、(爻)、殳,身字取码为身、丨、(力),耳字取码为耳、丨、(爻)。交叉结构单独成字或单独成声旁时也需拆分,与部首拆分规则一样,按首、二、三、末或首、二、末拆分,如吏的编码为(ナ)、口、丿、乀,使的编码为扌、(ナ)、口、乀。
部首起笔的交叉结构,按常规编码,如颗取码为日、木、页,俺取码为亻、大、日、乚,泽取码为氵、又、二、丨,单字取码为丷、日、一、丨。当该交叉结构为末码时,以交叉结构的起笔部首结尾,如禅取码为礻、乛、丷、日,驿字取码为马、 又、二,举字取码为(氵)、一、八、二。
日与曰单独为字或声旁时易于区别,作为编码部件时容易混淆,为不产生歧义,规定两点,一是该类字型不与其它部件交叉时看作日,如混的编码为氵、日、比,最的编码为日、耳、又,二是当与其它部件交叉时先写完日后交叉为日,否则为日,如伸的取码为亻、日、丨,而油的取码为氵、曰、丨。
词汇的取码规则是,双字词依次取各字部首和声旁的首码;三字词取第一字首码,再依次取第二字部首和声旁的首码,最后取第三字的首码;四字或大于四字词依次取一、二、三字首码,再取末字首码。如过程的取码为寸、辶、禾、口,部署的取码为立、阝、罒、 运动员的取码为二、二、力、口,联合国的取码为耳、入、一、囗;“形形色色”的取码为二、二、、,“心有余而力不足”的取码为心、ナ、人、足。
本发明提供了单码简码和双码简码。单码简码取原码的首码,空格键结束。如我字取码为丿,他字取码为亻。双码简码分单字简码和双字词汇简码。单字简码按书写顺序依次取部首和声旁的首码,独体字取首、二码,空格键结束,双字词汇简码依次取各字首码,空格键结束。如你字取亻、,她字取女、(力),您字取亻、心,七字取(弋)、乚,我们取丿、亻,他们取亻、亻,因为取口、丶,如果取女、日,经济取纟、氵。
对于大多数汉字来说,取码顺序与与汉字结构是一致的。如左右结构的河、勃的部首分别为氵、力,上下结构的花、熟的部首分别为艹、灬,包围结构的国的部首为囗,半包围结构的周、过、题的部首分别为冂、辶、页,独体结构的向、为、凸的部首分别为丿、丶、丨。这些汉字可按以上编码规则编码。但有少数汉字的取码顺序与结构是不一致的,如属部首攵的整字,属部首爫的孵字,属部首丿的卵字,属部首亠的就字。本发明规定这类汉字按结构取码,在前的结构按双码部首取首、二码,在后的结构按声旁取首、末码。如整的编码是木、口、二、止,孵的编码是丿、乚、爫、子,就的编码是亠、口、尢、丶。它们对应词汇的编码分别取该字前后结构的首码,如整齐取木、二、齐、丿,孵化取丿、爫、亻、(丸)。
部首规范码的简码出现概率远大于其它输入方法而最接近理论值。部首规范码使用部首作统一的编码部件,且在编码规则中利用汉字部首和声旁的形声主流结构进行编码,与国民教育背景知识很接近,因而易学不易忘。本发明具有简码出现概率高、码长短的优势,可以实现对汉字输入的快速盲打。
权利要求
1.一种汉字编码方法,编码部件由汉字部首组成,按笔形特怔将简体字和繁体字部首分类,同类部首布置在相同键位上,横起笔的类别有一类,一王玉門鬲雨比歹牙旡无镸类,镸長馬髟二类,二示亚亞豆干車耳厂类,厂辰石豕而页頁面艹类,艹 廾 廿甘其革黄兀类,兀西酉土类,土士工 老走赤鼓麦青十类,十支 大类,大犬 ナ类,ナ尢龙韦寸类,寸扌弋戈戊车木类,木麥耒匚类,匚臣瓦至竖起笔的类别有丨类,丨卜攴虎止齿卤齒鹵虫类,虫刂类,刂业黹非韭口类,口田黑曰罒目鼎見貝口类,口黾邑足山类,山日类,日里冂类,冂皿肉内巾骨冃黽贝见撇起笔的类别有丿 类,丿钅豸片爫儿入匕舌长氏夂 类, 爪斤瓜戶人 类,人食飠 金侖舍几 类,几殳风風彳 类,彳彡 类,色饣鱼魚夕舛角欠勹鸟禾 类,禾采黍香手毛 类,攵气缶矢牜 牛生白 类,白自血臼鳥鼠鼻鬼身舟龜亻 类,亻隹爻 类,爻丸犭月 类,月用点起笔的类别有丶 类,丶宀冖忄户穴门礻冫 类,冫斗丬丷 羊米父谷首八氵 类,氵心灬 类,灬火 亠 类,亠玄文音言齊辛立龍 方高衣衤齐乀 类,乀广 类,广疒麻鹿辶讠折起笔的类别有肀 类,肀 聿隶彐艮門廴又乛 类,乛子孑癶 疋矛马弓己巳已民尸 类, 刀羽卩阝亅 类,亅小 水女 类,女母毋 力 皮乚 类,乚彑凵中艸巛爿纟乙 类,乙飞飛○厶 类,厶幺 糸按汉字部首和声旁的书写顺序分别取部首码和声旁码,部首最多取两码,声旁最多取三码,总长最多取五码,不属形旁结构的独体字取四码。长度为两码的字补加一末码。
2.按照权利要求1所说取部首码时将以下这些部首作为双码部首使用,横起笔画有一 类,門鬲歹牙旡 镸 类,馬髟二 类,亚亞豆干車耳厂 类,辰而頁面艹 类,甘其革黄兀 类,酉土 类,老走赤鼓麦青十 类,支 ナ 类,龙韦车木 类,麥耒匚 类,至竖起笔画有丨 类,虎齿卤齒鹵刂 类,黹非囗 类,田黑目鼎貝口 类,黾邑 山 类,山(左边)日 类,日(左边)冂 类,巾骨贝撇起笔画有丿 类,豸片舌氏夂 类, 爪斤瓜戶人 类,飠龠舍几 类,风風 类,饣鱼夕舛角禾 类,禾(左边)采黍香 类,气缶矢牛自 类,鼠鼻鬼身舟亻 类,隹爻 类,犭点起笔画有丶 类,穴门礻冫 类,丬 羊米父谷首灬 类, 亠 类,玄文音齊龍 方高衤齐广 类,疒麻鹿折起笔画有肀 类,聿隶彐艮門乛 类, 疋矛马 类,羽女 类,力 皮乚 类,爿按首、二码取双码部首。
3.按照权利要求1所说的部首分类在计算机键盘上的分布为A键,土类B键,冂类和月类C键,亻类和亅类D键,二类和厂类E键,人类和几类F键,一类和镸类G键,十类和广类H键,亠类和乀类I键,冫类J键,丨类和虫类K键,刂类和口类L键,口类M键,木类和匚类N键,ナ类O键,氵类和肀类P键,灬类和乛类Q键,禾类和厶类R键,丿类和 类S键,艹类和兀类T键,大类和类U键,丶类V键,白类和 类W键,彳类和类X键,爻类和女类Y键,山类和日类Z键,乚类和乙类
4.按权利要求1和2,编码总长为四码,单码部首的汉字,声旁取首、二、末码,双码部首在前的汉字,声旁取首、末码,双码部首只有书写在先时才取两码,书写在后仍按单码部首取码,独体字按首、二、三、末取码。
5.按权利要求4,部首和声旁的相对位置与取码顺序不一致时,按结构顺序取码,在前结构视为双码部首取码,在后结构视为声旁取码,
6.按权利要求4,单码部首在前,声旁在后且只由一个部首组成的左右结构,声旁拆分为首、二、末码,若属其它结构声旁不拆,补末码,若是双码部首,声旁由一个部首组成,声旁不拆,也不补码。
7.按权利要求1和2,由单个部首组成的汉字拆分为先取该部首,再从第二部件开始、取二、三、末码,由单个部首组成的声旁的拆分为,先取该部首,再从第二部件开始,取二、末码,有四个部首不拆,重复取码,它们是日、月、目、口,单笔画部首也重复取码。
8.按权利要求1、2、7,取码按最大原则,并允许两编码部件重复笔画,单笔画起笔的交叉结构,归类到具有同一笔形特怔的分类部首,这种归类仅作为取码部件而不是部首,横起笔交叉的归到ナ类和艹类,撇和竖起笔交叉的归到爻类,折起笔交叉的归到女类、肀类和亅类,交叉结构的拆分与部首拆分规则相同,部首起笔的交叉结构,按常规编码。
9.按权利要求1、2,词汇的取码规则是,双字词依次取各字部首和声旁的首码;三字词取第一字首码,再依次取第二字部首和声旁的首码,最后取第三字的首码;四字或大于四字词依次取一、二、三字首码,再取末字首码。
10.按权利要求1、2,单字的单码简码取原码的首码,单字的双码简码按书写顺序各取部首和声旁的首码,词汇的双码简码依次取各字首码。
全文摘要
汉字部首规范码及键盘输入是一种汉字编码和输入方法,该方法利用笔形特征统一将简、繁体部首分类后作为编码部件,记忆量少,采用按部首和声旁分别编码的方法可与汉字结构保持一致。部首规范码既可对简、繁体字单独编码输入,也可对简、繁体字混合编码输入。部首规范码的编码部件和编码规则以国民教育背景知识为基础,容易学习,输入速度快,是一种适用范围广泛的汉字输入方法。
文档编号G06F3/023GK1359050SQ00132180
公开日2002年7月17日 申请日期2000年12月20日 优先权日2000年12月20日
发明者郑天河 申请人:郑天河
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1