|
楼主 |
发表于 2020-2-22 21:45:01
|
显示全部楼层
偶已经找到用法了,呵呵,
部分原文如下:
3 码表原文件格式
码表原文件是一个扩展名 .TXT 的文本文件,它包含了目标输入法全部的特征信息和编码规则信息,是对目标输入法的完整描述。
码表原文件必须是Unicode 文件格式。要将已有的码表原文件转换成 Unicode 格式,可使用“附件”中的“记事本”将其打开,选中“文件”菜单中的“另存为”命令,进入“另存为”对话框后将“另存为 Unicode"复选框选中并单击“保存”按钮即可。
码表原文件分为三个区段:Description、Rule和Text区段。
·[Description]区段
该区段描述了目标输入法的基本属性,包括六个入口:
入口(Entry) 含义 描述
Name 目标输入法的名称 该码表安装后此自定义名出现在提示行的“输入法名”框中。
MaxCode 目标输入法的最大编码长度 用户设置编码的最大长度。输入键数达到最大码长时,程序查找所对应的中文,显示中文,此时若出现重码,用户可用“0"~"9"或鼠标选择输入。对于编码不足最大码长的编码,用空格键作为结束。
MaxElement 目标输入法的信息元 1:单符 2:多符
UsedCodes 目标输入法的码元集 构成编码的基本元素,如有的编码以英文字母的“a"~"z"作为码元,有的则以十个阿拉伯数字作为码元。某些特殊字符不能作为码元,如“<",“>",“-",“=",“+"等。
WildChar 目标输入法的查询键 在录入时若是对编码的某一个键把握不准,可通过查询键迅速找到所需要的字或词。一般用“z"或“?"定义查询键,用户也可以指定自己习惯的字符作为查询键。查询键只对一个码位有效,不能同时查询两个或两个以上码位。
NumRules 目标输入法的构词规则数
·[Rule]区段
该区段描述了目标输入法的构词规则。构词规则是由若干构词规则表达式组成,下面给出构词规则表达式的定义:
c[逻辑符][词语长度]={[序号标识][汉字序号][取码序号]+{[序号标识][汉字序号][取码序号]+{[序号标识][汉字序号][取码序号]+...}}}
说明:
构词标识 c
逻辑符 e:等于 a:大于等于
词语长度 用'1' - 'f'表示,范围1 - 15
序号标识 p:正序 n:逆序
汉字序号 用'1' - 'f'分别表示第1 -15个字
取码序号 该字构词码序号,取值范围:'0'- MaxCodes。'0'表示取该字的所有编码;对于没有构词码的字,取其汉字编码。
示例:
Ce2=p11+p12+p21+p22 表示二字词,取第一字的第一、二码,第二字的第一、二码。
Ce2=p10+p20 表示二字词,取第一字的所有码和第二字的所有码。
Ca4=p11+p21+p31+n11 表示四字以及四字以上的词,取第一字的第一码,第二字的第一码,第三字的第一码,和倒数第一字的第一码。
·[Text] 区段
给出具体的编码表。
每一行定义一个汉字/编码映射,格式为“中文字串+编码字串”。中文字串和编码字串之间没有任何字符,其顺序按编码字串排序。编码字串中的字符必须是码元集中定义了的字符。
码表原文件示例
[Description]
Name=郑码
MaxCodes=4
MaxElement=2
UsedCodes=abcdefghijklmnopqrstuvwxyz
WildChar=?
NumRules=3
[Rule]
ce2=p11+p12+p21+p22
ce3=p11+p21+p32+p31
ca4=p11+p21+p31+p41
[Text]
一a av
一下aa
可歌可泣aaav
一开始aaez
无可奈何aagn
·提示
码表原文件可以只有[Text]区段,[Description] 和 [Rule]可以省略,留待创建输入法时填写。 |
|