规则的特点是简单好用,但需要人工干预太多,人肉能创建的规则也有限。打个比方吧,你可以创建无数个这样的规则:
给大家看张图就明白了:
2、将上述分词结果与规则库按照一定算法做匹配,得出匹配度最高的规则。假定在规则库中有一条天气的规则:城市库+日期库+气象库,从而大致可以推测用户可能想问某个地方某天的天气
5、将结果返回给用户
机器学习说简单也很简单,说复杂也复杂,本质上就是从事物抽取出特征,在根据以往数据的特征去预测未来数据的特征。从数学的角度来说,历史数据甲乙丙得丁,甲乙戊得丁,甲乙辛得丁,那么得到的模型就是甲乙得丁,跟第三个特征无关。
问答机器人的回答本身很难用机器学习,因为即使你的准确率达到95%,生成的语句仍然缺乏基本的人类逻辑。但机器学习一定是用在微软小冰上面了,像基础的分词,词性标注,主干分析等等都需要机器学习,而对于规则的整理很可能也用到各种机器学习的方法。蚂蚁君猜测可能使用机器学习的方法对问题分类,但最终整理的答案内容还是人肉生成的。
微软官方称小冰的交互水平已经相当于一位16岁少女的智商了,但蚂蚁君这样的聊天机器人目前看来更接近模仿者,如若模仿到能产生深层思考和自主提问的程度,才能说脱离了模仿人类,具有自身创造性,不仅是搜集数据,还能创造数据并应用,完全的AI至少是和人类自主行为平起平坐的,能超越则当然更好。
蚂蚁新闻(mayixinwen)诚意原创
转载请注明出处 侵权必究