您现在的位置: 主页 > 资讯 > intel英特尔&微软Microsoft > 微软推出ConceptGraph以更好理解自然语言
本文所属标签:
为本文创立个标签吧:

微软推出ConceptGraph以更好理解自然语言

来源:网络整理 网络用户发布,如有版权联系网管删除 2018-10-20 

undefined

网易科技讯11月3日消息,据美国媒体报道,微软研究院公开了其为解决让自然语言难以理解的困难之一而进行的努力,这个困难就是知识。该公司认为,背景知识是人类与机器在语言理解上的主要差别之一。

Probase是一个知识数据库,微软在该产品上开发了相当一段时间。该数据库是开放工具MicrosoftConceptGraph(微软概念图)的基础。Probase包含了540万个概念,超过了如提供12万个概念的Cyc等其他知识数据库。

所有这些互联信息的目标是混合解释与可能性以支持文本分析,非常类似人类使用排除法完成同样任务的方法。例如,如果我说“themanranfromthestrangerwiththeknife”,你最可能理解为这个人逃离了一个手拿刀的陌生人。但这个句子的意思也可以是你从陌生人手中夺走了刀并逃离。

undefined

但逃跑意味着害怕,刀与害怕有关,因此最简单、最直接的解释占据优势,即使可能不是很准确。微软的ConceptTaggingModel(概念标签模型)以此为基础开发以用相同概率想法对文本进行分类映射。接着上面的例子,刀也可指厨房用具或武器,但从上下文看,最可能是武器而不是从博物馆中偷来的17世纪餐刀。

厨房用具和武器都是相对普遍的东西,但博物馆的艺术品有点长尾概念。微软的模型规模宏大,同时考虑了高度可能性和极度不可能性以解释属性、子语境和关系。今天发布的版本可对任何文本词条排定分类相关性。微软基础级概念化将优先排定有效和合适种类以及其他方法如MI、PMI、PMIk和Typicality。

未来版将能包含他们称的“根据语境的单个实例概念化”,基本上将“陌生人”和“刀”与所代表的意思联系起来。对更长远的未来,该团队希望解决“短文本概念化”,甚至进一步拓宽在搜索、广告和AI内的应用范围。(木秀林)

undefined



              查看评论 回复



嵌入式交流网主页 > 资讯 > intel英特尔&微软Microsoft > 微软推出ConceptGraph以更好理解自然语言
 微软 文本 概念

网站地图

围观()