中文的输入法根据输入特点大致可分为三类:音码、形码和音形码.
根据汉字拼音设计的输入码,即拼音输入法。 常见的拼音输入法如下: 1. 简拼输入法:输入声母或声母的首字母来进行输入的一种方式。例如,我想输入“计算机”,则输入jsj
使用简拼输入,要求有强大的联想能力、丰富的词库。
全拼输入法:输入汉字的全部拼音,声母和韵母。例如,我想输入“计算机”,则需输入jisuanji
全拼提高了准确性,但增加的码长,牺牲了输入速度。
双拼输入法:对全拼的改进,将23个声母和24个韵母根据特定的组合分布在26键上,输入汉字的声母+韵母进行输入的一种方式。 以小鹤双拼为例(不同方案的双拼布局有所差异),当我想输入“青岛”,则仅需输入QK(qing)DC(dao)四个字母
双拼输入法有一定门槛,需要熟悉声母和韵母的布局,减小码长,从而提高输入速度。
根据汉字的构造特点设计的输入法,常见的形码输入法如下: 1. 五笔输入法:完全依据笔画和字形特征对汉字进行编码的输入法,字根表如下:列如我想输入“湖北”,则需键入IED(湖)UX(北)。
音形码是音码与形码的结合,即拼音+字根=字的输入方式,常见的音形码输入有: 1. 二笔输入法:又称二笔/两笔输入法,采用拼音首字母与笔画(两个笔画取一键)相结合的方式取码。 当想输入“武汉”时,需键入WH(武)HC(汉)
当然除了上述举例的输入法之外,还有其他许多的输入法,但基本实现原理与上述几种输入法一致。
当然关于输入法还有不同的布局方式,常见的有: - 九宫格 - qwerty - qwertz(德国) - azerty(法国)等。
就汉字输入法而言,除了上述按键输入,还有手写输入,语音转文字输入等方式,涉及到图形识别处理,语音识别处理更为复杂,暂且不展开介绍。 通过上述粗略介绍大致也能感受到输入法是一门复杂且灵活的设计艺术。输入法的设计和选择需要依据不同国家语言的构造特点,使用习惯,文化特点等个方面来设计,使之能够达到既快又准的目的。
模糊音/输入:将部分容易混淆、不易区分的音节在输入时相互通用的一种功能设置,以部分提高输入效率。如zh = z;ch = c; sh = s;n = l ;h = f; ang = an; eng = en ;iang = ian ;uang = uan等。 例如搜狗拼音输入法的模糊配置如下:
字典:同《新华字典》作用一样,即收录输入法有效的文字的集合,以Android google 拼音输入法字典为例,共计16466个有效汉字,当然这些不是全部汉字,具不完全统计,常用的汉字有7000+,总共的汉字有9w+;字典中的1.6w+的汉字足以满足日常使用了(当然也可以自行添加)。
词库:即输入法的词语数据库,词语资料的集合,以Android google拼音输入法的词库为例:
共计65105行,词库中包含了单字、最多四字的词语/成语。其中: 第一列表示字词,与第四列拼音对应。 第二列表示权重,可以理解为在侯选列表中的顺序优先级,数值越大优先级越高。 第三列表示联想,1则打开联想,0则关闭联想,具体实现原理未知。 第四列表示音标,与第一列字词组对应。 可以想象,词库越大,越能提高输入词语的丰富度。提升输入体验,针对类型和作用的不同,词库又可以进行细分: 基础词库为系统自带的或根据用户输入习惯生成的词库,细胞词库则是根据需要从外部导入的特定行业和场景特点的词库。 但词库越大,输入内容的过滤,联想等功能的性能就越低,词库越大也会导致重码率增大。
会发现重码的字很多,并且首页没有我预期的字,由于“珍”字默认的码率较低,需要向后翻页查找,当使用笔顺辅助码:zhen + tab + hh则能快速筛选出“珍”:
这里的辅助码为笔顺码:h(横)s(竖)p(撇)n()z(折);辅助码可以自定义,除了笔顺还有音调,如戏(xi + tab + 4);拆字辅助码,如栖=木 + 西(qi + tab + mx)
输入gaic,可以正常得到“武汉”:
...... 本文已结束 ......