img.jpg

小狼毫/鼠须管/中州韵之大名,我早有耳闻。(不过这种一个RIME输入引擎,不同的系统上(Windows/OSX/Linux)起不同名字的做法有点奇怪。)之前就试用过一段时间,嗯,一小段时间:感觉是各种不方便,当时在windows下安装还会显示有两个输入法。最近一段时间又想起来了这回事,就下定决心弄一个能用的配置。废话不多说,直接上配置代码!Git

Windows下配置文件位置在 %APPDATA%/Rime。具体配置文件定义在这里,各个选项定义在这里。(官方wiki有点乱)

试用感想

折腾了好久终于搞好了一个能用的版本,既有emoji又有英语词库,可以🌸🌺🌼🌻👨🏻👩🏻各种输入。但是使用了一段时间以后还是感觉各种不方便,因为它的逻辑本身就是无视上下文的,而输入方式又是(几乎是)基于字符串匹配的。同时自带的很多扩展词库本身是没有优先级的,因此造成的后果是输入的时候碰到生僻、甚至不那么生僻的词汇,都会变成从词汇表里不断搜索的一个过程。同时,作为一个单机输入法,它注定不如搜狗,而在词库的优化上,也并比不上微软拼音。

我想到的解决方法,有两个:一是添加一个支持self-host的词库服务器,或者甚至可以将词库托管到类似IPFS的分布式网络里,当然这个还是得面对隐私问题;二是等待自然语言处理的进步,直到某一天肯定能产出优秀的单机深度学习输入法的。

放弃使用小狼毫,还是有几点舍不得的地方的,比如标点符号的自定义「」这种,在微软拼音里只能通过自造词来实现了,目前是zz=「」。另一点是Emoji输入,好在微软拼音也支持部分emoji吧。比如emo=😈

试用感想 2

小狼毫的词库做的太差了,不是一般的差,而是非常无敌及其的差👎🏻。

举个例子,在luna_pinyin.history.dict.yaml里有*陸貽典*这个词,但是输入liuyidian(留一点)第一个就是这个词。这个人是明末藏书家,看起来放到hitory字典里很正确。但是问题是,像是 阿骨打 八一宣言 这类知名度比较高的在词库里也就罢了,阿噶巴尔吉汗 公车司马令 哀公 阿桂 这种东西凭什么在词库里啊!先试试把这个莫名其妙的词库删了,会不会好一点吧。

定制内容

  • TSF格式输入法(即输入行在行内)
    • 删除空格分割
  • 魔改版brisk主题
  • 内置Emoji输入
    hua
  • 内置英语输入(使用COCA20000词库1)
    english
  • 各种短语输入(这是小狼毫自带的)
    • vv - 输入颜文字。( ̄∇ ̄)
    • /man - 显示帮助
    • 各种其他短语。

配置

default.custom.yaml

customization:
  distribution_code_name: Weasel
  distribution_version: 0.14.3
  generator: "Rime::SwitcherSettings"
  modified_time: "Sat Jul  6 14:36:21 2019"
  rime_version: 1.5.3
patch:
  "ascii_composer/switch_key":
    Caps_Lock: noop
    Control_L: noop
    Control_R: noop
    # Shift自动上屏
    Shift_L: commit_code
    Shift_R: commit_code
  # 候选字个数
  "menu/page_size": 7
  # 输入方案。其实只用luna_pinyin_simp即可
  schema_list:
    - {schema: luna_pinyin_simp}
    - {schema: 20k_en}
  # 切换输入方案快捷键。没啥用。
  "switcher/hotkeys":
    - "Control+Alt+0"

weasel.custom.yaml

customization:
  distribution_code_name: Weasel
  distribution_version: 0.14.3
  generator: "Weasel::UIStyleSettings"
  modified_time: "Sat Jul  6 22:01:59 2019"
  rime_version: 1.5.3
patch:
  style:
    # 外观设定。
    layout:
      border: 0
      border_height: 0
      border_width: 0
      margin_y: 6
    color_scheme: brisk
    # 貌似没啥用
    corner_radius: 1
    # 字体设定
    font_point: 13
    font_face: "Segoe UI"
    # 横行显示候选字
    horizontal: true
    # TSF格式,字母输入到input里
    inline_preedit: true
    # 下面三条没啥用
    line_spacing: 5
    spacing: 10
    display_tray_icon: false
  # 修改主题
  "preset_color_schemes/brisk/border_color": 0xcfcfcf

luna_pinyin_simp.custom.yaml

# 输入方案配置
patch:
  # 载入自定义词库表
  translator:
    dictionary: mickir
    enable_sentence: false
    # 把preedit里的 ' 删除
    preedit_format:
      - "xform/'//"
  # preedit分隔符改成 '
  "speller/delimiter": "'"
  # 默认英文
  "switches/@0/reset": 1  #表示将 switcher 列表中的第一个元素(即 ascii_mode 开关)的初始值重设为状态1(即“英文”)。
  
   # 20k_en设置(这里下载了easy_en.schema.yaml 和 easy_en.dict.yaml以后,可以换成easy_en)
  "schema/dependencies/@next": 20k_en
  # 載入翻譯英文的碼表翻譯器,取名爲 english
  "engine/translators/@next": table_translator@english
  # english 翻譯器的設定項 
  english:
    dictionary: 20k_en
    spelling_hints: 9
    # 自动完成
    enable_completion: true
    enable_sentence: false
    # 候选词排名优先级,还是不太满意
    initial_quality: 0
    # 删除候选字里的自动完成提示(没有用,因为效果是输入eng以后,提示:english ~lish)
    comment_format: 
      - "xform/[~a-z]*//"

  # Emoji支持
  # 切换Emoji
  "switches/@next":
    name: emoji_suggestion
    reset: 1
    states: [ "🈚️️\uFE0E", "🈶️️\uFE0F" ]
  # 增加Emoji过滤器
  "engine/filters/@before 0":
    simplifier@emoji_suggestion
  # 使用opencc(即简繁转换)的方式实现emoji输入,可以理解为简-emoji转换。
  emoji_suggestion:
    opencc_config: emoji.json
    option_name: emoji_suggestion
    # 设置为all会显示tips,其他任何值都不会显示。
    tips: none

  simplifier:
    option_name: zh_simp

  # 不懂,也许有啥用。
  recognizer:
    patterns:
      email: "^[A-Za-z][-_.0-9A-Za-z]*@.*$"
      uppercase: "[A-Z][-_+.'0-9A-Za-z]*$"
      url: "^(www[.]|https?:|ftp[.:]|mailto:|file:).*$|^[a-z]+[.].+$"
      # 简写用
      punct: "^/([a-z]+|[0-9]0?)$"
  
  # 改寫拼寫運算,使得含西文的詞彙(位於 luna_pinyin.cn_en.dict.yaml 中)不影響簡拼功能(注意,此功能只適用於朙月拼音系列方案,不適用於各類雙拼方案)
  # 本條補靪只在「小狼毫 0.9.30」、「鼠鬚管 0.9.25 」、「Rime-1.2」及更高的版本中起作用。
  # "speller/algebra/@before 0": xform/^([b-df-hj-np-tv-z])$/$1_/

  punctuator:
    # 载入默认symbols.yaml,可以替换成mysymbols.yaml
    import_preset: symbols
    half_shape:
      "#": "#"
      "`": "`"
      "~": "~"
      "@": "@"
      "=": "="
      "/": ["/", "÷"]
      '\': ["、", '\']
      "'": {pair: ["「", "」"]}
      "[": ["【", "["]
      "]": ["】", "]"]
      "$": ["¥", "$", "€", "£", "¢", "¤"]
      "<": ["《", "〈", "«", "<"]
      ">": ["》", "〉", "»", ">"]
    symbols:
      "/fs": [½,,¼,,,¾,]
      "/dq": [🌍,🌎,🌏,🌐,🌑,🌒,🌓,🌔,🌕,🌖,🌗,🌘,🌙,🌚,🌛,🌜,🌝,🌞,,🌟,🌠,,,,🔥,💧,🌊]
      "/jt": [,,,,,,,,,,,,,,🔃,🔄,🔙,🔚,🔛,🔜,🔝]
      "/sg": [🍇,🍈,🍉,🍊,🍋,🍌,🍍,🍎,🍏,🍐,🍑,🍒,🍓,🍅,🍆,🌽,🍄,🌰,🍞,🍖,🍗,🍔,🍟,🍕,🍳,🍲,🍱,🍘,🍙,🍚,🍛,🍜,🍝,🍠,🍢,🍣,🍤,🍥,🍡,🍦,🍧,🍨,🍩,🍪,🎂,🍰,🍫,🍬,🍭,🍮,🍯,🍼,🍵,🍶,🍷,🍸,🍹,🍺,🍻,🍴]
      "/dw": [🙈,🙉,🙊,🐵,🐒,🐶,🐕,🐩,🐺,🐱,😺,😸,😹,😻,😼,😽,🙀,😿,😾,🐈,🐯,🐅,🐆,🐴,🐎,🐮,🐂,🐃,🐄,🐷,🐖,🐗,🐽,🐏,🐑,🐐,🐪,🐫,🐘,🐭,🐁,🐀,🐹,🐰,🐇,🐻,🐨,🐼,🐾,🐔,🐓,🐣,🐤,🐥,🐦,🐧,🐸,🐊,🐢,🐍,🐲,🐉,🐳,🐋,🐬,🐟,🐠,🐡,🐙,🐚,🐌,🐛,🐜,🐝,🐞,🦋]
      "/bq": [😀,😁,😂,😃,😄,😅,😆,😉,😊,😋,😎,😍,😘,😗,😙,😚,😇,😐,😑,😶,😏,😣,😥,😮,😯,😪,😫,😴,😌,😛,😜,😝,😒,😓,😔,😕,😲,😷,😖,😞,😟,😤,😢,😭,😦,😧,😨,😬,😰,😱,😳,😵,😡,😠]
      "/ss": [💪,👈,👉,👆,👇,,👌,👍,👎,,👊,👋,👏,👐]
      "/dn": [, , , , , , , , , ↩︎, , , , , , , , , ]
      "/fh": [©,®,,,,,,,,,,,,,,☑︎,,,,,,,,,,,]
      "/xh": [,×,,,,,,,,,,,,]
      "/man": [ 符號:/fh, 單位:/dw, 標點:/bd, 數學:/sx, 拼音:/py, 星號:/xh, 方塊:/fk, 幾何:/jh, 箭頭:/jt, 電腦:/dn, 羅馬數字:/lm, 大写羅馬數字:/lmd, 拉丁:/ld, 上標:/sb, 下標:/xb, 希臘字母:/xl, 大写希臘字母:/xld, 數字:/0到/9, 分數:/fs, いろは順:/iro, 假名:/jm或/pjm或/jmk到/jmo, 假名+圈:/jmq, 假名+半角:/jmbj, 俄語:/ey, 大写俄語:/eyd, 韓文:/hw, 韓文+圈:/hwq, 韓文+弧:/hwh, 結構:/jg, 偏旁:/pp, 康熙(部首):/kx, 筆畫:/bh, 註音:/zy, 聲調:/sd, 漢字+圈:/hzq, 漢字+弧:/hzh, 數字+圈:/szq, 數字+弧:/szh, 數字+點:/szd, 字母+圈:/zmq, 字母+弧:/zmh, 表情:/bq, 音樂:/yy, 月份:/yf, 日期:/rq, 曜日:/yr, 時間:/sj, 天干:/tg, 地支:/dz, 干支:/gz, 節氣:/jq, 象棋:/xq, 麻將:/mj, 色子:/sz, 撲克:/pk, 八卦:/bg, 八卦名:/bgm, 六十四卦:/lssg, 六十四卦名:/lssgm, 太玄經:/txj, 天體:/tt, 星座:/xz, 星座名:/xzm, 十二宮:/seg, 蘇州碼:/szm ]

mickir.dict.yaml - 我的词库

# Rime dictionary
# encoding: utf-8
#

---
name: mickir
version: "2019-07-05"
sort: by_weight
use_preset_vocabulary: true
import_tables:
  - luna_pinyin
  - luna_pinyin.extended
  # - luna_pinyin.extended/luna_pinyin.english
  # 以下两个通用扩展词库任选其一启用即可
  #- luna_pinyin.extended/luna_pinyin.practical      #A.挺全面的基本词库,含很丰富基本词条和组句语料,成语、俗语、诗词、人名词条不多。40w
  - luna_pinyin.extended/luna_pinyin.comprehensive   #B.很全面的一般性综合词库,除基本词条还包含文、史、餐、饮、医、药、生、化、金融、人名等等。80w
  # 分类扩展词库
  - luna_pinyin.extended/luna_pinyin.basis     #精选的基本词库,搜集于拼音加加、小麥、新酷音、維基百科等。
  - luna_pinyin.extended/luna_pinyin.city_beijing      # 北京地理信息词库,包含北京的常用地名
  # - luna_pinyin.extended/luna_pinyin.city_chongqing    # 重庆地理信息词库,包含重庆的常用地名
  - luna_pinyin.extended/luna_pinyin.universities      # 国内高校名称词库
  - luna_pinyin.extended/luna_pinyin.hanyu  #汉语大词典,多为2字词。 2.2w
  - luna_pinyin.extended/luna_pinyin.poetry #常用诗词,来源于唐宋诗词、千家詩、花間集、楚辭、詩經。 2.6w
  # - luna_pinyin.extended/luna_pinyin.cn_en    #中英混合词条,含如哆啦A梦之类的词条,目前词库很小。  
  - luna_pinyin.extended/luna_pinyin.net    #网络流行词,网上聊天常用的语句。3.6w
  #- luna_pinyin.extended/luna_pinyin.gd   #粤语词库,广东人必备。1.2w
  # - luna_pinyin.extended/luna_pinyin.game  #游戏词库、单机/网游及相关词条。7k
  #- luna_pinyin.extended/luna_pinyin.moba   #Moba游戏用词,含LOL和DOTA及它的亲爹—魔兽的词条。5k
  # - luna_pinyin.extended/luna_pinyin.game_wow          # 魔兽世界词库
  - luna_pinyin.extended/luna_pinyin.computer_science  #电脑词汇,计算机科学相关,普通应用足够
  - luna_pinyin.extended/luna_pinyin.history   #历史词库,囊扩中国古代史、近代史、现代史和世界历史。10w
  - luna_pinyin.extended/luna_pinyin.name    #人名词库,含中外名人。1w
  - luna_pinyin.extended/luna_pinyin.idiom   #俗语,如题,含常用俗语,文青必备。6.6w
  - luna_pinyin.extended/luna_pinyin.classical  #成语,含常用成语、文青标配。2.8w
  - luna_pinyin.extended/luna_pinyin.diet   #饮食词汇大全,吃货必备。 15w
  - luna_pinyin.extended/luna_pinyin.anime   #动漫词汇大全,动画、主要角色、声优等等。3w
  - luna_pinyin.extended/luna_pinyin.chat   #日常聊天常用词,请叫我聊天达人。3.5k
  - luna_pinyin.extended/luna_pinyin.daily   #日常生活用词,衣、食、住、行、地放、称呼等等。31w
  #- luna_pinyin.extended/luna_pinyin.movie   #电影相关词汇,片名、演员、导演神马的。1.3w
  #- luna_pinyin.extended/luna_pinyin.music   #音乐相关词汇,歌曲、制作人、歌星之类的。2w
  - luna_pinyin.extended/luna_pinyin.biaoqing  #颜表情,ಠ_ಠ、(。>ㅅ<。)、(☍﹏⁰)、( ̄_ ̄|||)..     0.2k
  - luna_pinyin.extended/luna_pinyin.website   #网站大全,百度、知乎神马的。5k
  - luna_pinyin.extended/luna_pinyin.extra_hanzi   #异体字,日文汉字
...

我的名字

参考配置