音形特征码汉字编码方法

文档序号:6601550阅读:586来源:国知局
专利名称:音形特征码汉字编码方法
技术领域
本发明涉及汉字编码方法,尤其是涉及一种音形特征码汉字编码方法。
目前汉字编码方法种类繁多,有的编码方法拆字规则太繁琐,规律性不强,需要在键盘上标注字根,令人难以理解和记忆;有的编码方法如公开号为CN1098525A的专利“形声复合码”是一种将字母码和数字码进行组合的编码方法,但它字根太多,字母码也复杂,不便于记忆,影响输入速度;有的编码方法虽容易拆分、容易记,但重码率过高,平均每字击键数较多,词组容量也有限,实用性不强,难以普及。
本发明的目的在于提供一种汉字拆分容易、编码简单、重码率低、词组容量大、输入迅速的音形特征码汉字编码方法。
本发明的目的是这样实现的本发明是将汉字的基本笔画分为横、竖、撇、捺(包括点)、折五种,通过对五种基本笔画进行组合分类形成字根,这些字根以组字频率较高的偏旁部首为主,再辅以一些常用字根,通过象形、会意、读音、联想等手段将具有某一共同特征的字根归类,分别对应于相应的26个英文字母键。
字根的拆分原则为1、按照书写顺序拆解字根;2、取大优先即优先拆取笔划较多的字根;3、散优于连,连优于交即先拆散笔字根,没有散笔字根就拆相连字根,最后才考虑交叉字根;4、兼顾直观。
本发明的单个汉字的编码方法为采用四键组合成一个编码,第一键取单个汉字发音的声母所对应的英文字母键,第二、三键分别取单个汉字按照书写顺序的第一、二个字根所对应的英文字母键,第四键取单个汉字末笔画所对应的数码键。
单个汉字的编码以数码键结尾,单个汉字的五种基本末笔画横、竖、撇、捺(包括点)、折分别对应于1、2、3、4、5五个数码键。
常用单个汉字的一级简码编码由单个汉字的第一键和第四键组成,单个汉字的二级简码编码由单个汉字的第一、二、四键组成。
本发明根据人们对汉字的发音和数字的反应比较敏感的特点,将声母、字根、数字进行组合编码,而编码中只需要二个能够代表汉字主要特征的字根,并且单个汉字编码以数码键作为结尾键,词组四键全为字母键,这种编码方法使词组容量非常大,通过使用丰富的词组和简码字,使重码率大大降低,因此本发明具有汉字拆分容易、规律强、编码简单、不用在键盘上标注字根、易学易记、输入迅速、词组容量大、重码率低的优点,是一种新型的汉字编码方法。
表1为本发明的字根总表。
表2为本发明的一级简码表。
下面结合表1、表2对本发明作进一步详细说明。
该编码方法是将汉字的基本笔画划分为横、竖、撇、捺(包括点)、折五种,通过对这五种基本笔画进行组合分类,形成的字根按照某一共同特征进行归类后,分别对应于相应的26个英文字母键。
本发明的字根拆分原则为1、按照书写顺序拆解字根;2、取大优先即优先拆取笔划较多的字根;3、散优于连,连优于交即先折散笔字根,没有散笔字根就拆相连字根,最后才考虑交叉字根;4、兼顾直观。
参见表1的字根总表,归类到字母A上的字根有“宀冖穴雨金(钅)”,归类到字母B上的字根有“阝耳卩 白日曰自身舟”,归类到字母C上的字根有“夕 歹米耒西酉匚臼鼠”,归类到字母D上的字根有“足辶廴走之彳石舌”,归类到字母E上的字根有“王三五麦禾ヨ(彑)肀 聿)”,归类到字母F上的字根有“一不禾示(礻)豆”,归类到字母G上的字根有“弓马鸟( )韦广 鹿户鬼”,归类到字母H上的字根有“丨上止卜十齿虍卤皮”,归类到字母I上的字根有“讠言丶亠方立六辛台 ”,归类到字母J上的字根有“乙角刀刂斤鱼”,归类到字母K上的字根有“竹 丿气缶牛 ”,归类到字母L上的字根有“力九龙尢犬 大ナ犭豕 ”,归类到字母M上的字根有“爪爫采瓜才寸扌手”,归类到字母N上的字根有“冂几月门乃贝骨用风”,归类到字母0上的字根有“口囗母(毋)田四皿目且 归类到字母P上的字根有“尸( )己已巳巴 衤(衣) ”,归类到字母Q上的字根有“戈弋戋( )七 由甲申电黑”,归类到字母R上的字根有“人亻矢八儿入谷癶 ,归类到字母S上的字根有“饣(食)纟幺 毛髟彡巾”,归类到字母T上的字根有“丁厂土士干二耂辰”,归类到字母U上的字根有“艹廿甘革其 凵 也”,归类到字母V上的字根有“小心()忄火灬  ”,归类到字母W上的字根有“山艮( )水氵巛川”,归类到字母X上的字根有“女文攵夊ㄨ父又厶マ”,归类到字母Y上的字根有“羊  丬( )片疒习丶 ”,归类到字母Z上的字根有“子孑孓予矛了虫 工车”。
下面分别说明单个汉字、词组的编码方法一、单个汉字的编码方法1、单个汉字(四键)的编码方法为采用四键组合成一个编码,第一键取单个汉字发音的声母(若为双声母zh、ch、sh,则取头一字母z、c、s)所对应的英文字母键,第二、三键分别取单个汉字按照书写顺序的第一、二个字根所对应的英文字母键,第四键取单个汉字末笔画所对应的“1、2、3、4、5”五个数码键,其中数码键“1、2、3、4、5”分别对应五种基本笔画“横、竖、撇、捺(包括点)、折”。
例汉字“汉”的声母为“H”,第一、二个字根分别为“氵又”,末笔画为“”,因此其编码为“HWX4”;汉字“算”的声母为“S”,第一、二个字根分别为“竹目”,末笔画为“丨”,因此其编码为“SKO2”;规定“阝、辶、七、方、之”等字根的数码键为5,“女、戈、匕、九、乃、习”等字根的数码键为3。
理论上该编码方法单个汉字的容量为23×26×26×5=77740(个)。
2、常用单个汉字一级简码(二键)的编码方法取单个汉字的第一键(声母键)和第四键(数码键)的组合。
参见表2常用单个汉字一级简码如下A啊A1岸A2按A3爱A4俺A5B百B1并B2比B3不B4边B5C册C1常C2厂C3从C4吃C5D但D1岛D2第D3的D4地D5E二E1而E2俄E3恩E4儿E5F否F1弗F2分F3凡F4方F5G各G1个G2广G3国G4刚G5H和H1华H2户H3会H4还H5J经J1角J2究J3就J4即J5K可K1开K2矿K3快K4克K5L里L1率L2另L3来L4了L5
M面M1幕M2秒M3每M4们M5N难N1年N2能N3你N4那N5O鸥O1哦O3欧O4偶O5P盘P1牌P2批P3票P4片P5Q且Q1千Q2钱Q3去Q4却Q5R日R1儒R2仍R3人R4乳R5S上S1市S2少S3是S4甚S5T同T1听T2它T3天T4他T5W王W1午W2我W3为W4万W5X向X1需X2乡X3下X4现X5Y一Y1用Y2要Y3亦Y4元Y5Z在Z1中Z2找Z3总Z4这Z53、单个汉字二级简码(三键)的编码方法为取单个汉字的第一、二、四键进行组合。
例汉字“码”的二级简码为“MD1”;汉字“机”的二级简码为“JF5”;汉字“字”的二级简码为“ZA1”;理论上二级简码的容量为23×26×5=2990(个)。
本编码方法的单个汉字的编码以数码键作为结束单个汉字的输入,计算机可在用户输入数码键后立即将汉字显示在屏幕上,而不需用空格键作为结尾。
二、词组的编码方法1、二字词词组的编码方法分别取两个汉字编码的第一、二键按秩序排列的组合。
例词组“汉字”的编码为“HWZA”;词组“科学”的编码为“KEXV”;理论上二字词词组的容量为23×26×23×26=357604(个)。
2、三字词词组的编码方法为分别取三个汉字编码的第一键按秩序排列,再补充空格键作为结尾的组合。
例词组“计算机”的编码为“JSJ□”;词组“北京市”的编码为“BJS□”;理论上三字词词组的容量为23×23×23=12167(个)。
3、四字词词组的编码方法为分别取四个汉字编码的第一键按秩序排列的组合。
例词组“实践经验”的缩码为“SJJY”;词组“平易近人”的编码为“PYJR”;4、多字词词组的编码方法为分别取前三个汉字及最后一个汉字编码的第一键按秩序排列的组合。
例词组“中华人民共和国”的编码为“ZHRG”;词组“中国共产党”的编码为“ZGGD”;三、本编码方法还设计有学习键1、若不知道第一键(声母键)时,可用字母U、I、V中任一键代替,因为声母中没有字母U、I、V。
2、不知拆何字根时可用符号键“=”代替。
3、不知数码键时,可用除1~5以外的数码键代替。
4、若为词组,第一键可用字母U、I、V中任一键代替,其余第二、三、四键可用符号键“=”代替。
表1字根总表字母字根A 宀冖穴雨金(钅)B 阝耳卩 白日曰自身舟C 夕 歹米耒西酉匚臼鼠D 足辶廴走之彳石舌E王三五麦采ヨ(彑)肀( 聿)F 一不木示(礻)豆G 弓马鸟( )韦广 鹿户鬼H丨上止卜十齿虍卤皮I 讠言丶亠方立六辛台 J 乙 角刀刂斤乛 鱼K 竹 丿气缶牛 L 力九龙尢犬 大ナ犭豕 M 爪爫采瓜才寸扌手N 冂几月门乃贝骨用风O 口囗母(毋)田甲皿四目且 P 尸( )己已巳 巴衤(衣) Q 戈弋戋( )七 由甲申电黑R 人亻矢八儿入谷癶 S 饣(食)纟幺 毛髟彡巾T 丁厂土士干二耂辰U 艹甘廿革其 ㄩ 也V 小心()忄火灬W 山艮( )水氵巛川X 女文攵夊乂父又厶マY 羊  冫丬( )片疒习 Z 子孑孓矛予了虫豸工车表2常用单个汉字一级简码如下A啊A1岸A2按A3爱A4俺A5B百B1并B2比B3不B4边B5C册C1常C2厂C3从C4吃C5D但D1岛D2第D3的D4地D5E二E1而E2俄E3恩E4儿E5F否F1弗F2分F3凡F4方F5G各G1个G2广G3国G4刚G5H和H1华H2户H3会H4还H5J经J1角J2究J3就J4即J5K可K1开K2矿K3快K4克K5L里L1率L2另L3来L4了L5M面M1幕M2秒M3每M4们M5N难N1年N2能N3你N4那N5O鸥O1哦O3欧O4偶O5P盘P1牌P2批P3票P4片P5Q且Q1千Q2钱Q3去Q4却Q5R日R1儒R2仍R3人R4乳R5S上S1市S2少S3是S4甚S5T同T1听T2它T3天T4他T5W王W1午W2我W3为W4万W5X向X1需X2乡X3下X4现X5Y一Y1用Y2要Y3亦Y4元Y5Z在Z1中Z2找Z3总Z4这Z权利要求
1.一种音形特征码汉字编码方法,其特征在于1.1、是将汉字的五种基本笔画横、竖、撇、捺(包括点)、折进行组合分类、形成的字根按照某一共同特征进行归类后,对应于相应的26个英文字母键;1.2、字根的拆分原则为(1)按照书写顺序拆解字根;(2)取大优先;(3)散优于连,连优于交;(4)兼顾直观;1.3、单个汉字的编码方法为采用四键组合成一个编码,第一键取单个汉字发音的声母所对应的英文字母键,第二、三键分别取单个汉字按照书写顺序的第一、二个字根所对应的英文字母键,第四键取单个汉字末笔画所对应的数码键;1.4单个汉字的编码以数码键结尾,单个汉字的五种基本末笔画横、竖、撇、捺(包括点)、折分别对应于1、2、3、4、5五个数码键。
2.一种如权利要求1所述的音形特征码汉字编码方法,其特征在于常用单个汉字的一级简码编码由单个汉字的第一键和第四键组成。
3.一种如权利要求1所述的音形特征码汉字编码方法,其特征在于单个汉字的二级简码编码由单个汉字的第一、二、四键组成。
4.一种如权利要求1所述的音形特征码汉字编码方法,其特征在于归类到字母A上的字根有“宀冖穴雨金(钅)”,归类到字母B上的字根有“阝耳卩 白日曰自身舟”,归类到字母C上的字根有“夕 歹米来西酉匚臼鼠”,归类到字母D上的字根有“足辶廴走之彳石舌”,归类到字母E上的字根有“主王三五麦禾ヨ(彑)肀 聿)”,归类到字母F上的字根有“一不木示(礻)豆”,归类到字母G上的字根有“弓马鸟( )韦广 鹿户鬼”,归类到字母H上的字根有“丨上止ト十齿虍卤皮”,归类到字母I上的字根有“讠言丶亠方立六辛台 ”,归类到字母J上的字根有“乙 角刀刂斤乛 鱼”,归类到字母K上的字根有“竹 丿气缶牛 ”,归类到字母L上的字根有“力九龙尢犬 大ナ犭豕 ”,归类到字母M上的字根有“爪爫采瓜才寸扌手”,归类到字母N上的字根有“冂几月门乃贝骨用风”,归类到字母0上的字根有“口囗母(毋)田四皿目且 ”,归类到字母P上的字根有“尸( )己已巳巴コ衤(衣) ”,归类到字母Q上的字根有“戈弋戋 七 由甲申电黑”,归类到字母R上的字根有“人亻矢八儿入谷癶 ,归类到字母S上的字根有“饣(食)纟幺 毛髟彡巾”,归类到字母T上的字根有“丁厂土士干二耂辰”,归类到字母U上的字根有“艹廿甘革其 凵 也”,归类到字母V上的字根有“小心() 忄火灬  ”,归类到字母W上的字根有“山艮 水氵巛川”,归类到字母X上的字根有“女文攵夊ㄨ父又厶マ”,归类到字母Y上的字根有“羊  丬( )片疒习 归类到字母Z上的字根有“子孑孓予矛了虫 工车”。
全文摘要
本发明公开了一种音形特征码汉字编码方法,它是根据人们对汉字发音的声母和数字的反应比较敏感的特点,将汉字的声母,字根以及数字进行组合编码,通过单个汉字以数码键结尾,词组四键全为声母这一巧妙的编码方法,从而给词组留下一个很大的空间。该编码方法运用特征记忆法将众多字根进行归类后分别对应于26个英文字母键,因此具有形象直观,不用在键盘上标注字根、易学易记、拆分容易、规律性强、输入简单、词组容量大、重码率低的优点。
文档编号G06F3/023GK1115889SQ9510921
公开日1996年1月31日 申请日期1995年7月31日 优先权日1995年7月31日
发明者程光远 申请人:程光远
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1