灯泡短路 , 软硬挨踢

搜狗输入法智慧版

#云计算 , #情境 , #情景感知 , #拼音加加 , #搜狗 , #整句输入 , #智能学习 , #智能狂拼 , #输入法

搜狗输入法最近推出了智慧版,宣传的功能亮点如下:
1、情景感知:配合 IE 内核的浏览器使用时,根据不同的输入框调整候选词排序;
2、文思泉涌:诗词提示补全,并且展示诗词信息;
3、妙笔生花:提示近义词用于丰富词汇(算是不错的功能,类似于英语输入助手类工具的近义词联想);
4、搜狗卷轴:候选字用矩阵形式展示(貌似是紫光最先实现的);
5、拼音纠错:自动纠正和提示错误的拼音;
6、长词联想和云计算:都不是新鲜功能了。

情景感知的思路不错,可是因为技术限制和输入法本身的定位,距离我的期待还挺远的。
第一,看介绍是只能通过输入框感知情景变化,而且只针对 IE 内核浏览器;
第二,只对候选词排序有效,对整句无效——如果只是用来优化词组调频,还是无法帮助用户精简输入过程中多次选择候选词组并确认上屏的操作。

搜狗等新一代输入法一直在词组和智能整句输入模式上精神分裂,有云端识别长句的优势,拿整句智能识别当卖点,但既做不到像智能狂拼那样以整句模式为中心和终极目标,又不像拼音加加专心做词组输入。

几年前在智能狂拼的 QQ 群中扯谈的时候,我曾经说到,整句输入法(以前的黑马,后来的智能狂拼、微软拼音包括新版的英库)的识别率如果要继续提高,除了云计算等更大语料库的支撑外,自动情境识别也应该是重要手段(智能狂拼3是有语境切换功能的,但是手动变更语境后切换词库、键盘方案、设置和皮肤)。
同一个人,写公文和聊天,和朋友扯谈和与家人沟通,发邮件和写报告,在不同的网站进行不同的发言,其语言习惯都是随情境变化的。
另一方面,情境往往变化频繁,比如同时挂 IM 多窗口聊天、刷论坛、赶文档,是非常常见的场景,而用户不会明显感知情境有变化,一切对他来说都是自然而然的。
如果整句识别输入法不加区分的用同一套模型对付多种情境,那么识别率永远都被限制在较低的水平。而如果每次切换情境都要用户自己操作,那么不会有人使用这个功能。

所以,如果按搜狗输入法智慧版情景感知的思路走下去,最终我期待的效果是:
第一,捕捉所有应用了输入法的程序的动作,为不同的程序、沟通对象、使用场景分别建立情境;
第二,根据程序窗口、输入框、沟通对象、文件命名、上下文内容等等信息,自动识别和切换情境;
第三,对应不同情境,不但候选词排序要有变化,云端的整句识别结果也要有所区别。

真正做到了这些,我才会认为输入法是有智慧的。