您现在的位置: 主页 > 资讯 > 人工智能AI > 用人工智能破解微软小冰 | AI前线
本文所属标签:
为本文创立个标签吧:

用人工智能破解微软小冰 | AI前线

来源:fromnet 网络用户发布,如有版权联系网管删除 2018-09-21 



类似小冰这样的产品说简单也简单,说复杂也复杂。单纯从外面看你会觉得小冰与去年人人网上流行的小黄鸡类似,但在技术实现上有本质的差异。


微软小冰智能聊天功能的实现其实是正好整合了人工智能领域当今发展出的三大主要分支::第一,基于规则的人工智能;第二,无规则,计算机读取大量数据,通过数据统计、概率分析等方法进行智能处理的人工智能;第三,基于神经元网络的一种深度学习。


基于规则来处理:



规则的特点是简单好用,但需要人工干预太多,人肉能创建的规则也有限。打个比方吧,你可以创建无数个这样的规则:


如果(问题是你好),那么回答(你好)如果(问题包含吃饭,并且问题的长度小于6),那么回答(我爱美丽,但我更是个吃货)……
比如图上对这种对小冰提要求式的对话,开灯,关灯,讲个笑话之类的,这就是基于人工规则来处理的。开发者把这些规则保存到数据库里,剩下不在规则里的问题直接用一些乱七八糟的话蒙混过关就完事了。
像对话机器人的话,规则是必须有的,而且应该大部分答案都需要规则的参与。


基于高级大数据搜索来处理:


给大家看张图就明白了:



假如用户问:北京后天的温度是多少度?
如果采用纯搜索引擎的思路(基于文本挖掘、NLP的思路不尽相同,但可参考此思路),此时实际流程上分成几步处理:
1、对输入语句分词,得到北京、后天、温度3个关键词。分词时候利用了预先建好的行业词库,“北京”符合预先建好的城市库、“后天”符合日期库、“温度”符合气象库

2、将上述分词结果与规则库按照一定算法做匹配,得出匹配度最高的规则。假定在规则库中有一条天气的规则:城市库+日期库+气象库,从而大致可以推测用户可能想问某个地方某天的天气


3、对语义做具体解析,知道城市是北京,日期是后天,要获取的知识是天气预报
4、调用第三方的天气接口,例如中国天气网-专业天气预报、气象服务门户 的数据

5、将结果返回给用户


以上例子其实很粗糙,实际上还有诸多问题没提到:语义上下文、语义规则的优先级等等。
例如用户上一句问:北京后天的温度是多少度?下一句问:后天的空气质量呢?这里实际上还涉及语义上下文、用户历史喜好数据等等诸多问题。


机器学习



机器学习说简单也很简单,说复杂也复杂,本质上就是从事物抽取出特征,在根据以往数据的特征去预测未来数据的特征。从数学的角度来说,历史数据甲乙丙得丁,甲乙戊得丁,甲乙辛得丁,那么得到的模型就是甲乙得丁,跟第三个特征无关。


问答机器人的回答本身很难用机器学习,因为即使你的准确率达到95%,生成的语句仍然缺乏基本的人类逻辑。但机器学习一定是用在微软小冰上面了,像基础的分词,词性标注,主干分析等等都需要机器学习,而对于规则的整理很可能也用到各种机器学习的方法。蚂蚁君猜测可能使用机器学习的方法对问题分类,但最终整理的答案内容还是人肉生成的。


此种处理方法存在的最大问题:规则库还主要依赖于人工的建立,虽然有一定的学习能力,但自我学习能力还是较弱。可以借助一些训练算法来完善规则。


微软官方称小冰的交互水平已经相当于一位16岁少女的智商了,但蚂蚁君这样的聊天机器人目前看来更接近模仿者,如若模仿到能产生深层思考和自主提问的程度,才能说脱离了模仿人类,具有自身创造性,不仅是搜集数据,还能创造数据并应用,完全的AI至少是和人类自主行为平起平坐的,能超越则当然更好。




蚂蚁新闻(mayixinwen)诚意原创

转载请注明出处 侵权必究


90后写给90后年轻人的科技时尚商业第一站。蚂蚁新闻(mayixinwen)聚焦年轻人喜爱的新闻:新商业、趣科技、泛娱、轻奢、营养餐。拒绝千字以上长文,崇尚新闻互动有趣。做一只有态度、有角度、有温度的蚂蚁君。嗯,一起玩耍吧。




              查看评论 回复



嵌入式交流网主页 > 资讯 > 人工智能AI > 用人工智能破解微软小冰 | AI前线
 机器 数据 规则

"用人工智能破解微软小冰 | AI前线"的相关文章

网站地图

围观()