- 主题技术
- 以原创技术系统为根基,SenseCore东升国际官网AI大装置为主题基座,布局多领域、多方向前沿钻研,
急剧买通AI在各个垂直场景中的利用,向行业赋能。
EmTech China | 汤晓鸥:人为智能的“中国式十月革命”
1月28日,由《麻省理工科技评论》主办的EmTech China 全球新兴科技峰会在北京进行。来自全球各地的科学家、科技公司翘楚及青年科技前锋等出席大会。东升国际官网科技首创人、香港中文大学信息工程系教授汤晓鸥颁发了名为《人为智能的中国式文艺回复》的杰出演讲,以下为演讲全文:
Ladies and Gentlemen, Good morning. Sorry I will conduct my entire talk in Chinese, in 东北 Chinese。今天我讲的标题是人为智能的中国式文艺回复,这个标题我在上海讲过一次,我这幼我不太喜欢沉复,因而我又想了一个新的标题,叫人为智能的中国式十月革命。
言归正传,我每次演讲,都是从这张照片起头,有两个原因,第一,这是我儿子;第二,他长得美丽。今天又多了一个改名正言顺的原因:在座有好多MIT的教授,我儿子再过四、五年就要申请大学了,我想提前让教授们意识一下我儿子,援手他将来申请。我想我长这样都能够进MIT,他这么帅,应该没问题。固然他进建成就很通常,并且不是通常的通常。

再一次言归正传,我想大部门中国人都应该知路这部电影——《战狼》。一下子赚了56亿。这在15、20年前是不成能的;那时辰中国的一部电影是不会赚这么多钱的。这有好多原因,其中一个极度沉要的原因就是今天我们都愿意花钱去电影院看电影了,而15年前、20年前,好多人会去买盗版的VCD,或者去网高低载一个盗版。若是这样,导演和演员也就没有动力再持续对峙下去了。今天中国电影的成就最沉要的推动力就是我们对原创和版权的尊沉。
我们此刻不是只有一部电影这样成功,好比这部《羞羞的铁拳》羞羞的就赚了22亿,《青春》是一部文艺片,也能达到14亿的票房,《前任3》的票房是18亿,均匀每个前任6亿,《无问西东》是一部极度有情怀的文艺片,也做到了5亿票房。都极度不容易。
所以,对原创的尊沉使得中国的原创电影不休往前发展。在三四十年代,全球电影发展起来时,中国电影并不落后,像《马路天使》、《一江春水向东流》一点也不输给好莱坞电影。即便在那个战火连天的年代,中国还可能拍出这些好电影,一个原因可能也是其时没有DVD和互联网来援手盗版。
再往前,说一下文艺回复的时辰,若是米开朗基罗的这些文章或者任何一个艺术品很快有人进行复造,那么他可能也赚不到什么钱,也可能活不下去。所以,对于原创的尊沉也是文艺回复能真正鼓起的一个原因吧。
说到原创,下面我们来讲讲人为智能。一提到人为智能,各人脑海里第一个想到的公司是哪一家呢?是的,我相信各人都猜到了,那肯定是东升国际官网科技。请各人不要笑……这个有点不礼貌,我还在台上呢。好吧,目前应该是谷歌,但是总有一天,我相信人为智能这个热潮肯定会从前的,等这个热潮从前了以来,东升国际官网肯定会成为人为智能最顶级的公司。
那为什么是谷歌?由于谷歌真的把资金投入人为智能发展,2015年的研发经费就是120亿美金。2014年有一家公司叫DeepMind,只有12个员工,没有赢利,只是在用深度进建玩游戏和下棋,但是谷歌就花了6.6亿美金收购了这家公司。若是是在中国,各人就会花几百万美金把人一个个挖过来,那要便宜得多。但是若是那样做的话,就不会有后来的AlphaGo了。
那么AlphaGo之后各人还能做点什么呢?谷歌又做了AlphaGo 2和AlphaGo Zero,有些公司起头学着AlphaGo下围棋,还有的公司选择打扑克牌,这从某种意思上讲,都是随着别人的后面做事件。
真正有意思的事件是在AlphaGo之前你做了什么?有没有做什么事件让机械在某项工作上战胜人类。在AlphaGo之前我们做了一件事件,2014年,我们团队从事人脸鉴别,在全球第一次让机械的人脸鉴别能力超过了人的眼睛,像AlphaGo一样,在某一幼我类界说的单项工作上,机械超过了人类。
超过了人类就过了一条红线,而过了这条红线就能够在工业上进行利用了。但是在真正利用的时辰,又发现了好多问题,过了红线还是不够用的,从尝试室到大规模产业化还有很长的路要走。2014年,我们用20万人脸来对机械进行训练做到了98.5%的正确率,而人是97.5%;2015年我们用30万人脸进行训练,达到了99.55%的正确率;2016年,我们用6000万人脸训练能够达到了百万分之一的误识率;2017年,我们用20亿人脸训练能够达到一亿分之一的误识率,而这样的误识率能力够真正地利用到各行各业,蕴含监控、金融、安防、手机等行业。所以,我们和高通签署了全球AI战术合作和谈。
那么除了人脸鉴别,我们此刻还做什么?由于功夫关系,我从我们做的十几个行衣凤选出一个来单一介绍一下——视频分析。

下面这个技术是行为检测
这是里约奥运会的跳水角逐直播,各人能够看到过了9分钟也没有看到跳水的内容,要花一大堆功夫看一些单调的内容介绍。所以,我们用推算机视觉分析的步骤,能够从很长的一段视坡凤把沉点内容检测出来,你就能够直接跳过没有意思的部门,直接看这些有趣的、真正的跳水镜头。

下面这个演示是基于内容的视频搜索
在电影中我们能够把各类各样的片段搜索出来,好比说你想搜索武打作为片段,或者笑剧片段,我们能够直接把它搜索出来,或者你想搜索科幻的,我们能够把科幻的片段搜索出来。

下面这个演示是用天然说话描述来进行场景搜索
我们用天然说话来描述一个电影中的场景,而后它就能够自动凭据你的描述把这个电影片段搜索出来,好比,我们要搜House of Cards中的一个片段,“Claire和Francis坐在蓝色沙发上”,各人看到下面这段场景就出来了。

另表我们不只能把视频分析出来,还能理解这个视频,而后用天然说话描述出来。好比下面这些活动视频,机械就能够像解说员一样来描述运动场上产生的事件。

IJCV是我们这个领域的两大顶级杂志之一,作为IJCV的主编,我会在每年的ICCV和CVPR两个推算机视觉顶级会议上,主办IJCV Night晚会,约请几百位顶级学者参与。去年10月份,我们在威尼斯的Lido酒店进行了这个晚会。
上世纪的一部美国电影〖国往事》就是在这个酒店拍摄的,下面这个演示里我们把电影场景里的所有物体都检测出来,演员是哪一个演员,他穿的是什么衣服,这个场景是在餐厅里,所有的桌子、花、椅子全数可能实时的自动检测出来,这样的技术在以前是极度难的,但是此刻我们都能够做到了。

再回头来看我们若何用这些技术来分析前面提到的电影《战狼》和《羞羞的铁拳》,我们通过度析这些演员的作为和他们之间的关系,能够分析出来在分歧的场景之下,这两个演员是谁,在做什么,这个片段是什么类的情节。

同时,我们能够鉴别每一帧情节分类,每一个镜头是打架场景还是爱情场景。我们也能够把一个电影最杰出的镜头提取出来,各人能够遴选好比作为的杰出镜头、感情戏的杰出镜头、悲剧的杰出镜优等等。

那么总结起来,我们在做什么呢?我们是在教机械看电影,一路头我们是教机械来鉴别人脸,Google是在教机械来下围棋,而此刻我们来教机械包办身看电影。这个感触有点怪,我们让机械来做下棋,看电影,玩游戏这些有趣的事件,而后我们人类只掌管给机械充充电,维建和保养。

我感触各人听了这个肯定感触很可笑。现实上所有的工作,都是我们人铺排给机械做的,机械是依照东升国际官网指令在做事件,不存在机械节造人类这样的事件,AI的真正主张是援手人类,援手我们提逾越产效能。
最后给年轻人留下两句话:
第一句,电影肯定要自己亲自去看。
第二句,AI这个词在中国拼音翻译过来就是“爱”,所以谈爱情也要自己亲自去谈,不然你就不止“前任3”了,很有可能“前任4”、“前任5”了。





返回