海知智能谢殿侠:人工智能的“未来已来”

Posted by

海知智能谢殿侠:人工智能的“未来已来”

3月20日,Xtecher的杭州第一场私享会在杭州市西溪艺术集合村Rokid研发中心如期进行。

人工智能时代何时会来,人工智能的未来之路到底如何?私享会从这两点切入,围绕“探索人工智能的未来之路”主题展开。海知智能CEO谢殿侠在私享会上从自家产品切入,谈了自己的看法。

谢殿侠说,Rokid是做产品,但海知智能是做技术平台。技术平台说起来很抽象,不像Rokid有直接的产品可以看到。为了让大家能更好理解海知智能做的事儿,他举了很多例子。比如,当你想要听音乐,如何通过海知智能的技术平台让一个机器人理解你的意思;当你听了张学友的音乐,第二次,你还想听,你再说“他”的时候,如何通过海知智能的技术平台让机器人知道你说的他是张学友而不是另一位歌手;再进一步,通过海知智能的技术,让你在使用机器人的过程中,使得机器人不断收集关于你的数据,然后进行学习,最终在你发出任何指令的时候,他都能够做出最准确的预判并为你服务。

谢殿侠表示,这仅仅只是一个例子,所有分享过程中说的这些都只是很小的一部分例子,他想要传达的是这样一种理念:海知智能来当中间方,将人类语言转化为机器语言,也让一个没有任何技术基础的人能够实现对机器的“驯化”。

以下为分享内容全文:

Rokid在做产品,我们是做一个技术平台,有些地方是重叠的,但有些地方会很不相同,我们的题目叫探讨未来之路,但是我觉得它也用了大家现在使用频率很高的一个词:未来已来。现在我们能做到什么?可能在去年或前年的大家认为讲概念的产品,但自今年起,可能三个月、六个月,也有可能是九个月,会落地起量。2017年将是非常有意思的一年,因为如果再过五年回头看的话,就会发现今年是里程碑的一年,很多不同品类的智能化产品会在今年被创造出来,成为我们日常生活常用品的一部分。

不远的未来,地球上机器人的数量可能不亚于人的数量,甚至从外形我们也很难简单区分哪个是人哪个是机器人,在我们生活工作中的方方面面都有机器人参与。

回到今年,为什么会有这么多人工智能类产品纷纷涌现出来并能开始普及呢?因为如果我们面向特定用户群体,针对特定使用场景,锁定特定的问题范围,如今的 AI 的能力能够做到让产品用户体验达到大家可以接受的范围。

讲讲我们的产品,有三个部分,首先提供语义api,即自然语言理解和开放知识图谱技术接口,就是来一句话或者一段文本,我们能让机器理解之后返回一段 json,就是机器能够理解的结构化数据。

第二部分bot工具箱。这个工具可以让非程序员,或者说让文科生也可以设计开发和训练机器人大脑。你可以非常快,几分钟就能做一款适合自己的个性化机器人大脑。如果对接到实体机器人、智能硬件或者微信公众号等,就可以和人对话聊天了。

第三块,Bot 入口这个服务还没有成型。将来机器人数量多了,可以有一个机器人社会。机器人之间可以互相介绍对接。

在整个 bot体系里面,我们起到一个中间环节的作用,一端把自然语言理解这块打包了,为做 bot 的品牌方提供服务;另外一段把一些领域服务打包了,可以让拥有知识和服务的人把他的知识和服务变成机器人大脑的一个技能插件。这样让做 bot 的人更容易接入更多技能插件以提高机器人的能力,反过来也给更多技能插件带来流量乃至收益。

同时,我们也在提人工加智能这么一个说法。什么意思呢?比如说机器可能开头能够解决20%的问题,后端还要人工来做80%一些工作;发展到一定阶段可能调转过来,乃至机器和人一起提供较为完善的用户体验和服务。

所以,我们不是 Siri,我们帮大家做自己的 Siri;我们也不是Alexa,我们更懂“中文本地化”,并且可以帮助大家做自己的 Alexa。

下面结合具体的例子说说,比如说天气服务。

一方面基本的意图理解能够(让机器)知道用户关于天气的不同说法,并且支持多轮对话。另外,和一般的天气服务不一样的地方是,我们可以做到针对性回答,你问下不下雨就可以只回答下不下雨,下雨还提醒你带伞;问雾霾只回答关于雾霾的问题,并支持个性化的语言风格比如关怀。不仅如此,更重要的是这些灵活的强针对性的个性化的做法不必工程师介入即可搞定,普通的大学本科实习生经过简单培训即可操作实现。

另外,说说音乐方面。

比如常见的语音查询,我要听谭咏麟的《讲不出再见》,系统理解了之后播放;再说“再放一首他的《朋友》”,系统应该知道你说的这个“他”是指谭咏麟,而不是指张学友等等。然后呢,换成周华建的歌,这个作者换了,但是歌没有换,前面是换了歌,没换作者。再有,比如说“李宗盛和周华建对唱的歌”,我要精确的知道这是一个合唱,而且这个合唱的作者是这两个人。

除了查询类问法之外,你可以说“我想听一些蓝调音乐”,甚至你还可以说“睡觉前听的歌”, 或者“我想听舒缓的英文音乐”,“适合散步听的古典音乐”等等。对于一个音乐方面的诉求,几乎任何的说法,系统都能够做到理解并找到你想要的音乐。而且你用的时间越长,它对你了解的越多,给出的音乐也会越是符合你的要求。

我们还能完成一些包含流程的复杂些的任务,比如在携程上预定一个酒店。用我们的工具和接口也不难让文科生在有限时间内实现对话交互的过程,而不需要程序员介入。

所以有了接口和bot 管理平台,三步即可做个机器人。

第一步,创意设计,我们前面讲了,确定目标用户、确定使用场景,确定要解决的问题,之后选择对应技能插件以及必要的话做精准覆盖的知识库。

第二步,训练学习。系统会把机器人和用户对话记录下来,机器人理解的置信度会透出来。Bot 运营者可以通过评星来确认或者否认机器人理解的准确度,比如你觉得这个理解错了,打一颗星,之后系统会问为什么错了,你可以告诉它,随着时间的推移,数据的积累,机器学习的训练模型就会往你期望的方向走。

第三步,所谓接入成人。形成了机器人大脑,可以直接对接到微信公众号上让用户体验,也可以接入到智能硬件等等。

前面提到了一个词——“知识图谱”,什么是知识图谱?比如说“王俊凯”,我们看到的实际上是三个字,电脑里作为一个字符串存储;但在真实世界里面,它会代表一个人,或者称之为”实体“。他有各种属性,比如他还可以叫“小凯”,他是什么时候生的,他是属于什么类型,这个类型是个人,不是个石头等;他又是TFBOYS的一个成员,而TFBOYS则是属于音乐团体等等。有了知识图谱,意味着在语言理解的时候,会带来更多的灵活性。比如说你可以问“我要听TFBOYS的《青春修炼手册》”,或者说“我要听小凯的《青春修炼手册》”,Bot掌握了这个知识图谱,可以对所有说法进行理解并且找到对应的答案。

知识图谱会让机器对不同话语的理解变成一件比较普通的事儿。

作为一个个性化机器人大脑技术服务平台,我们把复杂的自然语言理解和知识图谱的技术打包封装了,通过 bot 管理工具让普通人经过简单训练后即可快速有效做成个性化的机器人大脑,大大降低了技术门槛和设计开发周期,以期实现人人会做机器人。我们通过开放接口对接智能硬件、机器人或者微信公众号,当智能硬件或者机器人制造成本越来越低,不远的将来人人都能拥有独属于自己的机器人。

2017年是转折的一年,是从概念到落地的一年,是充满期待的一年,很多人还认为是未来产品的产品,今年即将走入千家万户,人工智能的“未来已来”。

以上是我个人的一些看法,感谢。