当前位置:财视传媒 让每一次传播都有价值 > 新闻资讯

科大讯飞谭昶:阿尔法狗的胜利在于将现实世界的期盼转为虚拟

财视media
作者 | 杨羽婷 2017-06-28 00:43
“它只能解决具体的、已经规定好了的规则问题,而没有办法解决一个没有规则的问题。”

6月27日,由财视传媒、传播达人汇主办的2017全球大数据传播大会在京举行。科大讯飞大数据研究院副院长谭昶出席并发表了个人演讲。

谈到阿尔法狗战胜李世石、柯洁事件,谭昶表示,阿尔法狗的胜利在于将现实世界的期盼转变为计算机内存中的虚拟的世界。将深度学习、强化学习、蒙特卡洛树搜索三者结合起来,阿尔法狗就成了最强的棋手。


他表示,人工智能对大数据有着很强的依赖性,如果没有足够多的数据输入,就像盲人摸象一,“只摸到了一只鼻子,永远不知道大象长什么样子的”,而只有拼接起来,才能对规律和现实有足够的认知。

“目前来讲,人工智能在这个问题上,只能解决具体的、已经规定好了的规则问题,而无法解决一个没有规则的问题。规则谁来定,现在只有人类来定。”谭昶指出,“人工智能是否已经超越人类”这个问题,应该从基础的角度进行思考,人工智能毕竟是一门技术,作为IT技术,它必然是可以理解的。


附谭昶演讲全文(经财视media 编辑整理):

各位朋友,大家好!我今天主要从人工智能企业的角度来给大家介绍一下我们对于大数据和人工智能之间的一点看法。

大家最近也看到了,阿尔法狗又胜利了。阿尔法狗和李世石、柯洁比赛的时候,我们坚定地认为,人工智能必将在围棋比赛中战胜人类最优秀的选手。而当时,大家会想,人工智能已经超越了人类?

从这个问题上面引申开来讲,人类是不是已经成为上帝,已经造出来拥有智慧的生命,这个智慧的生命终将向亚当和夏娃走出伊甸园而取代人和神呢?我们从基础的角度做了思考:人工智能毕竟是一门技术,作为IT技术,它必然是可以理解的。那我们怎么样理解它呢?


阿尔法狗的胜利在于将一个非常好的模型,一个现实世界的期盼转变为计算机内存中的虚拟世界。深度学习能够处理图像、处理音频、处理视频;强化学习就是对抗生成网络,两个人工智能可以自己跟自己进行比赛,自我学习、自我进步;第三个叫做蒙特卡洛树搜索。

这三个结合起来,AlphaGo就胜过了人类最优秀的棋手。从这个问题上,我们可以看到人工智能作为一种技术,它对于现实世界、大数据和其他技术的依赖性。人可以学,一生之中大概可以有效的学习两万张棋谱。我们前面也看到了这个数字,作为AlphaGo它自己和自己下了三千万盘棋,它从来没有遗忘过,它把这些棋记在它的内存里面。

它很少犯错。但人可能会重复的犯错误。人犯错误是有一定的惯性的。但是对于计算机来说,你的程序改进了之后,这个错误是不可能再出现的,这是一个确定性的问题。

从这三个点来讲,一个结论就是人工智能对于大数据其实有着更强的依赖性。为什么这么强?如果没有三千万盘棋,你从AlphaGo从两万盘棋里面超过人类几乎是不可能的。掌握了大数据才是真正的人工智能,才会有好的算法、好的技术。但是如果没有足够多的数据输入,就像盲人摸象一样,你只摸到了一只鼻子,永远不知道大象长什么样子的。只有拼接起来,才能对规律和现实有足够的认知。

目前来讲,人工智能在这个问题上只能解决具体的已经规定好的规则衍生的问题,而没有办法解决一个没有规则的问题。规则谁来定,现在只有人类来定。

讲到这一点,我们总结一下从大数据、人工智能,包括从整个六七十年代开始的IT技术的发展来看,人工智能走到这一步,我们感觉到人工智能终于走到每个人的身边。最早的时候我们的486、386,甚至更早的计算机,那个时候没有足够强的预算能力和数据,到了移动互联网时代我们有了超级计算机、云计算,有了非常多的数据之后,可以看到人工智能的技术对于计算能力,对于数据的要求非常之高。

在这个基础之上,为什么今天百度会说它是一家人工智能的企业?因为它掌握了非常多需要提供智能化服务的场景。为什么说现在的自动驾驶,现在的自然语言和智能语音助手也是人工智能的重要场景、重要入口?因为在这些场景之下,人工智能技术真正得到了应用和推广。

在这样的环境之下,我们要回过头来看看,大数据到底是怎么样从人工智能中获得收益的?有了众多数据,三千万盘棋人可以学完吗?人学不完,怎么办?没有被学习和利用的永远都只是垃圾,怎么样把它变成金子,变成价值。你必须要用一些技术去处理这些数据,数据处理技术里面,我们讲有四个层次。第一个层次是检索,你需要知识和理论,它的价值就出现了。第二个层次是统计,我们说C2M的时候,到底顾客有什么样的想法,比如顾客都要无毒的洗发水,顾客要无屏的投影机,我们就来造这个设备,这就是统计。

再到后面是个性化推荐。为什么个性化很难做?为什么只有一个今日头条和阿里巴巴?个性化的理解是非常复杂的过程。更上一个层次,我们能不能预测未来,既然我有充分的数据了解世界的现状了,我们能不能知道未来是什么样的,未来怎么样去预测。这样的预测过程需要什么样的工作,处理数据已经是人类所不能及的,怎么在自动化的过程里面提升到一个智能化的过程。我们就需要人工智能技术的支持。

比如自然语言,大家都在谈论车,我们想知道他们是想买,还是已经有车了。但是如果说一百万人、一千万人都在这里讨论的问题,你能不能精确把里面一万个想买车的人找出来,怎么找,这个时候我们只能让机器自己理解这些语言,理解这些语言里面最关键的那些内容是在讨论我是有车人,还是要买的车,我才能解决这个问题。

图像的数据,我们去处理人脸,我们找一张人脸,这一瞬间的工作是人去做,还是计算机在做。人来做显然不现实,全城里面那么多摄象头,怎么让人一张一张看,只有计算机和人工智能自己看才能把这个问题解决掉。


讲到这里,我们说到结论,人工智能是依赖于大数据来变的更加智能的。正如我们的语音识别引擎达到97%的准确率,需要10万小时语音数据的输入,没有这10万小时的大数据,人工智能引擎就没有用。有了这样的人工智能引擎以后,我们可以用它在讯飞输入法中服务4亿的用户,每个人输入的语音都可以得到正确的转换和处理,变成非常准确的文字。

大数据也因为人工智能的参与而变的得更有价值,因为人是听不完4亿用户说的语音,只有机器和人工智能能够这样不辞劳苦的把这个听完。

我简单介绍一下讯飞怎么构造人工智能、大数据和云计算之间的产业链。以人工智能为核心,我们刚刚讲到了我们有4亿的用户,我们有8.9亿推广的群体。这些用户每天35亿次的交互,经过了处理,我们知道他们的喜好,我们知道他们的年龄、性别,我们可以进行精准的广告推送。这个工作是大家比较熟悉的,但是更进一步来讲,讯飞作为一家在教育方面有着深厚耕耘的公司,我们把语音能力,工智能能力服务到一万所学校,包含全国的百强校里面的57所,包含了今年高考之中10位高考状元,他们从我们的服务里面得到了什么。他们的试卷现在不是人,不是老师来判的,是机器来判的。机器判完试卷之后,他们学习的成绩,他们学习的能力,通过机器的识别变成一个数据,这个数据被用于最终的个性化的学习、个性化的推荐过程中,他们的成绩可以提高10%以上。

今天没有人提到政府数据的问题。我们也知道政府数据是非常复杂和冗余的,这些数据怎么样更好的得到处理和加工,讯飞也做了非常多的尝试,可以把整个政府的办事服务流程缩短50%,再汽车、医疗相应的产业布局里面。我们永远是把人工智能怎么样更好地处理数据以及怎么样更好的让这个服务智能化,从而让我们整个产业、整个技术形成一个良好的闭环。

最后,我们用一句话来总结一下讯飞对于大数据、人工智能,包括所有IT技术之间关键性的联系。我们希望的智能化服务,无论大家在讲手机、讲自己的家庭、讲汽车、讲所有的IT相关的触达的地方,我们都在讲什么。我们讲的是,我希望这个服务是能够不断的自我学习、自我优化,这种服务和优化不是来源于一个人的数据,而是来源于所有人的数据,来源于整个社会贡献出来的海量数据。

而这样的一个服务,又因为我们的云计算,我们的互联网,而无处不在,无所不在。只有这样一种服务结合起来之后,我们才能认为我们真正的步入了智能化的社会,享受到了智能化的服务。只有这样的智能化服务,是我们所期望的一种未来的信息化的状态。



------------------------------------
本文为财视media原创,转载需附上出处及原文链接
更多精彩内容请关注:
财视传媒微信(ID:caishiMV)
Q群(418295218)


0 0
发表评论
   
还可以输入250个字 评论
活动专题
传播达人汇
TOP10
开启
财视传媒版权所有 京ICP备14031610号-1 增值电信业务经营许可证 B2-20190737 京公网安备 11010502030808号 Copyright 2019 caishimv.com. All Rights Reserved
登录          注册
2周内自动登录 忘记密码?
第三方登录