东升国际官网

申请试用
登录
  • hd-share-img01
主题技术
以原创技术系统为根基 ,SenseCore东升国际官网AI大装置为主题基座 ,布局多领域、多方向前沿钻研 ,
急剧买通AI在各个垂直场景中的利用 ,向行业赋能。

业界 | 东升国际官网王晓刚:你所不知的东升国际官网三维视觉产品世界

2019-07-17

文章出处:AI研习社


东升国际官网 AI 落地三步走战术


7 月 12 日-7 月 14 日 ,2019 第四届全球人为智能与机械人峰会(CCF-GAIR 2019)于丽江正式召开。


峰会由中国推算机学会(CCF)主办 ,雷锋网、香港中文大学(丽江)承办 ,丽江市人为智能与机械人钻研院协办 ,得到了丽江市当局的大力领导 ,是国内人为智能和机械人学术界、工业界及投资界三大领域的顶级互换博览盛会 ,旨在打造国内人为智能领域极具实力的跨界互换合作平台。


7 月 14 日下午 ,在「智慧城视驻视觉智能」专场上 ,东升国际官网科技结合首创人、钻研院院长、移动智能事业群总裁王晓刚带来了题为《从学术到产业化的人为智能》的主题分享。


王晓刚回首了人脸鉴别从学术到工业界的持续进取过程 ,以及人脸鉴别在智慧城视注智慧通杏注手机、AR、游戏等具体场景中的利用。


他提出 ,推算机视觉钻研有几个比力沉要的部门:


一是 基础层  ,蕴含芯片、AI 超算平台、深度进建平台等基础方面的钻研 ,在这方面 ,中国还有很长地路要走 ,西方尤其是美国当先我们好多。


二是 利用层  ,这一块中国是比力善于的 ,我们有极度丰硕的利用场景 ,这些利用场景能够给我们更多的反馈 ,驱动东升国际官网算法不休地进取。


三是 工具链 ,人为智能赋能百业 ,当分歧领域必要人为智能技术越来越多的时辰 ,它对科学家或者钻研员的需要是线性增长的。若何让通常的开发者、公测人员能够凭据东升国际官网工具链迅速开发出相宜的人为智能解决规划 ,使其出产力充分开释出来 ,这是将来我们必要面对的沉大课题。


在这个过程中 ,东升国际官网以往、此刻以及将来持续会做的是:


在算法精度不休提升的前提下 ,拓展智慧城市从 1 到 N 的业务天堑、推进 2D 感知到 3D 世界的落地 ,以及场景现实到虚构现实的融合。


2014 年 ,东升国际官网团队颁发 DeepID 系列人脸鉴别算法 ,使其全球初次超过人眼鉴别率 ,之后随着技术的持续进取 ,业务也不休突破天堑 ,从相对单一的 1:1 鉴别向 1:N 进发。


目前 ,东升国际官网所做的工作是若何从几万到几十万人中 ,鉴别和分析出用户想要找的人或者物 ,随着场景不休地拓展 ,王晓刚以为人脸会逐步成为人的身份标志。


另表 ,在 3D 的利用上 ,东升国际官网的 3D 人脸鉴别规划也已经在好多手机上得到利用。


王晓刚现场展示了手机上通过 3D 摄像头拍摄的人脸、物体以及人体图像进行 3D 沉建 ,将来 2D 的相册还能拓展到 3D 相册 ,人体的跟踪上也从 2D 延长到 3D。


以下是王晓刚教授大会现场全数演讲内容 ,雷锋网 作了不扭转原意的整顿及编纂:


王晓刚:


感激大会的约请 ,我是香港中文大学的一名教授 ,同时也参加东升国际官网在人为智能产业方面的落地 ,今天极度欣喜能有机遇与各人分享我在学术钻研与工业化落处所面的一点幼我体味与见解。

微信图片_20200617234310.png

我自己有这样的一些经历 ,我们在尝试室带着学生做钻研 ,更多地是利用有限的推算资源和数据资源做学术界里的经典问题 ,“作坊式”地实现一些创新和突破。


随着人为智能在工业界大规模落地 ,市场给了技术发展很大的助力 ,蕴含可钻研的内容、可钻研的工具、可钻研的大局。


我比力认同贾佳亚教员(查看 演讲内容)所说的将来分歧钻研领域的一些融合。


我以为此刻东升国际官网钻研更多地停顿在算法档次 ,将来的人为智能钻研很沉要的方面是软硬的结合、算法和芯片的结合、算法和传感器的结合优化 ,这些都是比力沉要的几个方向。


而这些方神驰往都必要更强的工业界支持 ,由于后者能够提供更多的硬件能力、更大的钻研课题。


首先 ,业务系统对于东升国际官网钻研是极度沉要的。好比一个通常城市 ,至少都有上万个摄像头 ,一年堆集的人脸数据超过上千亿 ,若是将这些摄像头连在统一个平台上 ,若何在大平台上进行高效能地图像搜索和大数据分析 ,这是尝试室中难以接触到的问题。


另表 ,东升国际官网推算平台在现有的一些工业钻研领域 ,可能同时使用几百块 GPU 训练一个模型 ,从而做到急剧反馈。


同时 ,还有好多长尾的人为智能问题必要解决。我们必要成立一套高效的工具链 ,能够做到全面的测试和评估。


好比我们做人脸鉴别、推算机视觉鉴别问题 ,在学术领域 ,我们在尝试室里也有工具 ,但真正工业利用落地其实要做大量的测试 ,后者会反馈出极度多的问题。


而以上这些身分 ,均是学术尝试室所不具备的。

微信图片_20200617234356.png

东升国际官网科技成立于 2014 年 ,草创钻研团队来自于香港中文大学 ,或许有 20 年汗青的学术积淀。


我们一向与学术界维持着亲昵地互换 ,蕴含与 MIT、南洋理工、清华、北大等高校都设有结合尝试室 ,能够提供分歧业业的人为智能算法和解决规划。


从前几年 ,我们除了做一些工业落处所面的钻研 ,也会两全学术方面的索求 ,在 ICCV、ECCV 上颁发了几百篇论文。

微信图片_20200617234433.png

我们和香港中文大学结合尝试室共同启动 OpenMMLab 开源算法库 ,其中蕴含了各人时时关注的推算机视觉问题 ,如物体的检测、行为的鉴别和超分等。


经典算法开源 ,能够援手各人更好地复现 ,目前也有一些其他院校参与到了这个开源平台的构建中。

微信图片_20200617234519.png

同时 ,我们还提供了 SenseAR 加强现实的开发者平台 ,这是学术和工业结合钻研的例子。


它不仅有加强现实 AR 和 AI 职能集成 ,从 SLAM 到人脸、人体的鉴别等 ,还能够部署到分歧的手机上 ,目前这个平台已经部署在超过 5000 万台的手机上。


我们以为做推算机视觉或者人为智能方面的钻研有几个比力沉要的方面:

一是 基础层  ,蕴含芯片、AI 超算平台、深度进建平台等基础方面的钻研 ,在这方面 ,我们还有很长地路要走 ,西方尤其是美国当先我们好多。

二是 利用层  ,这一块中国是比力善于的 ,我们有极度丰硕的利用场景 ,这些利用场景能够给我们更多的反馈 ,驱动东升国际官网算法不休地进取。

三是 工具链层,人为智能赋能百业 ,当分歧领域必要人为智能技术越来越多的时辰 ,它对科学家或者钻研员的需要是线性增长的 ,若何让通常的开发者、公测人员能够凭据东升国际官网工具链迅速开发出相宜的人为智能解决规划 ,使其出产力充分开释出来 ,这是将来我们必要面对的沉大课题。

微信图片_20200617234631.png

举几个例子 ,在算法精度不休提升的前提下 ,若何拓展智慧城市从 1 到 N 的业务天堑、推进 2D 感知到 3D 世界的落地 ,以及现实到虚构现实的融合?

微信图片_20200617234722.png

我们知路 ,人为智能的工业利用功夫点是在 2014 年 ,2014 年东升国际官网团队颁发 DeepID 系列人脸鉴别算法全球初次超过人眼鉴别率。


而后 ,好多人以为当技术超过肉眼鉴别率时 ,问题就已经解决的差不多了 ,其实不是这样 ,现实生涯中 ,好多场景对于技术的需要远远超过肉眼识此外水平。


2014 年 ,其时的技术误识率是在千分之一 ,此刻每年都有几个量级的增长。从从前几年中能够看到 ,随着人脸鉴别技术精度持续增长 ,它能够不休地突破业务的天堑。


此前 ,鉴别率比力低时 ,能够做 1:1 比对 ,如人脸、身份证进行线上线下认证 ,此刻好多产品已经呈此刻机场、酒店中。

微信图片_20200617234814.png

从 2017 年起头 ,人脸鉴别技术起头利用于手机解锁职能 ,手机虽幼但其要求更高 ,由于手机不只有鉴别正确 ,还要预防活体攻击 ,这其中还蕴含各类各样活体攻击方式 ,从照片到视频再到 3D 模型。

微信图片_20200617235011.png

从前几年里 ,东升国际官网 SenseID 人脸鉴别、活体检测水平持续提升 ,能够让这一项技术进入普罗公共的日常生涯中。


据统计 ,此刻人们每天使用手机人脸解锁这项职能超过 100 亿次。


若是 1:1 是相对单一的问题 ,1:N 就越发复杂。


我们必要罕见据库 ,这里的数据库可能是几万或者几十万量级。在门禁、闸机等通畅场景中 ,一个大楼或者公司有 1、2 万人的数据库;智慧城市的数据库可能达到几十万的量级。


东升国际官网所做的就是从几万到几十万人中鉴别和分析所必要找的人与物。随着场景不休的拓展 ,我们能够看到人脸慢慢的成为人的身份标志。

微信图片_20200617235043.png

此刻各人看到的是我们在上海西岸的“智慧公共空间治理平台” ,这个区域有密集的摄像头 ,能够通过人脸鉴别、跟物体的关联等 ,寻找到我们想要找的人或者迷失的器材。


此刻智慧城市利用里 ,我们能够看到有越来越多的摄像头拥有 AI 的职能 ,越来越多的摄像头能够衔接在统一个平台上。


为了数据安全和数据隐衷的; ,我们会逐步削减人为过问和标注 ,数据能够存储在客户那一端。


以前我们说算法机能的提升依附人为标注 ,此刻东升国际官网数据量有几十亿甚至上百亿的量级 ,不太可能靠人为标注 ,我们必要依附机械平生进建 ,使数据得到自动更新 ,部署系统和训练系统能够实现美满融合。


在 3D 利用方面 ,手机已经从单个 RGB 摄像头到多摄到 3D 摄像头。


2017 年起头 ,苹果利用了结构光 3D 摄像头 ,后面我们能够陆续看到好多手机厂商不休地推出这样的机型 ,把有深度进建的摄像头装在手机上 ,能够带来好多新的钻研课题和新的利用。

微信图片_20200617235124.png

回首一些各人比力熟悉的场景 ,看它若何从 2D 成长到 3D 并产生相应的利用。


好比最起头人脸的关键点 ,我们推出 106 幼我脸关键点 ,重要是做人脸的属性、人脸特效 ,用在互联网直播等。

微信图片_20200617235239.png

微信图片_20200617235242.png

我们从 106 点到更浓密的 240 幼我脸关键点 ,做的事件不仅是增长特效了 ,并且还有美妆 ,对人脸关键点的定位要求更正确。


化妆后出现关键点偏移 ,好比红嘴唇涂到牙齿高等等 ,这是我们不仅愿看到的 ,凭据关键点 ,我们有智能的美颜、美妆 ,更多的职能必要更多浓密的关键点和定位。


此刻手机上有了 3D 摄像头 ,我们能够实现人脸 3D 沉建 ,它对于技术的精度、推算复杂性、几何复杂性都提出了更高挑战。

微信图片_20200617235314.png

目前 ,我们已经在 OPPO、vivo 手机上实现了东升国际官网人脸 3D 沉建 ,凭据这个能够进行 3D 美颜、捏脸、微整形等。


更有趣的是 3D Avatar ,通过人脸驱动 3D Avatar ,除了人脸的沉建还有人体和通常物体的沉建 ,正是由于手机上有了深度的信息 ,能够给我们带来不一样的履历 ,2D 相册在将来能够拓展到 3D 相册。


人体关键点定位跟踪是学术界钻研很长功夫的课题 ,将来这个利用能够落地在好多场景中。

微信图片_20200617235411.png

蕴含服装、肤质的鉴别 ,我们能够凭据你的服装天生人体的形象 ,在互联网直播场景中 ,以前给人加各类各样的特效 ,此刻还能够针对每一幼我做虚构形象


另表 ,还能够设立虚构观多席 ,若是各人不能在现场参与像今天这样的大会 ,作为粉丝 ,你能够有自己的 Avatar 形象 ,能够在家里参与并进行互动。


最后 ,我想介绍人为智能和 AR (加强现实)的结合。


2017 年被各人看作是加强现实的元年 ,这一年苹果、谷歌颁布了 ARKit 和 ARCore 的平台 ,东升国际官网科技从 2016 年有自己的加强现实平台 SenseAR。

微信图片_20200617235453.png

2016 年我们重要支持娱乐互联网的直播、特效等职能。


2018 年 ,东升国际官网以原创 AR 开发者平台 SenseAR 为基础 ,结合 OPPO 共同打造 OPPO ARunit 平台 ,通过这个平台吸引更多的开发者参与 ,后面蕴含幼米等互联网公司也参与进来并基于此做了开发。

微信图片_20200617235534.png

这其中有 SLAM 技术、有各类 AI 职能 ,随着手机 3D 摄像头的出现 ,我们还有基于 RGBD 的 SLAM 和物体的沉建。

微信图片_20200617235604.png

能够看到 SLAM 技术的落地面对诸多挑战 ,必要应对动态的场景、弱纹理、复杂活动以及室表大场景。


这里为各人展示的是 OPPO 手机上有了 SLAM 技术和深度摄像头能够做 AR 丈量 ,你能够拿着手机丈量任何一个物体的大幼 ,还能够自动的检测场景中的各类状态 ,如方形、圆形、丈量身高档。


此刻对标苹果 AR 尺子的技术 ,在正确性或者数字化、速度高等各方面上 ,我们能够做得更好一些。


我们还做了 AR 导航 ,各人能够在大的购物中心、酒店等室内场景里找到自己的地位 ,在技术实现上 ,这是极具挑战的。


荆门国博中心是一个极度大的场景 ,我们能够进行 3D 地图沉建 ,用 SLAM 的技术实现室内导航。


若是你走丢了 ,能够通过手机 AR 导航职能选择路线 ,导航会自动带你到想要去的地位D芄豢吹剿诮谐【暗某两ê投ㄎ ,进行手机的导航。


另表 ,东升国际官网 AR 游戏跟《王者庆幸》合作 ,能够通过手机拍摄真实的场景 ,游戏里的人物会进行虚构和现实的融合。

微信图片_20200617235604.png

接下来为各人展示多人共享的 AR 云(SenseAR) ,针对单个前端的设备 ,我们利用 SLAM 技术进行场景的理解和定位。


若是几幼我同时想玩一个游戏 ,东升国际官网 AR 云能够把他们分歧手机上的坐标系统一到统一个坐标系下 ,实现跨平台的互动。

微信图片_20200617235714.png

东升国际官网 SenseAR 和手机厂合作 ,能够从手机到 AR 的平台 ,再到渲染的平台 ,贯通开发给开发者 ,将来有更多的开发利用和更好的履历。

微信图片_20200617235714.png

上个月 ,我们还成立了中国加强现实主题技术产业联盟 (China Augmented Reality Core Technology Industry


Alliance ,简称 CARA) ,我们知路国表的加强现实是由谷歌、苹果等巨头主导 ,好多钻研和创新必要结合产业链高低游的力量综合实现创新。


该联盟由手机厂商、钻研机构、模组厂商、算法提供商和 Sensor 厂商组成 ,能够形成结合创新。


这就是起头时谈到的——此刻和将来 AI 的钻研不单单是在尝试室钻研单点的问题 ,我们要联动产业链高低游 ,通过缜密的合作和市场反馈提供新的问题 ,实现创新的突破。


我们相信将来随着利用场景不休的丰硕会给我们 AI 钻研提出更多新的课题 ,我们和学术界、产业界一路把 AI 的钻研推向更前端 ,有更多的落地场景。


感激各人!


现场观多提问:


王教员好 ,我是香港中文大学的 Ph.D ,东升国际官网钻研院有这么多博士 ,我相信这是极度壮大的学术组织 ,但终于东升国际官网是贸易化的公司 ,我出格好奇东升国际官网钻研院若何平衡贸易回报和学术成就?


王晓刚:


我们对于学术成就的看沉不只是发论文 ,固然今天 PPT 中展示我们有几多篇论文 ,但这不是最沉要的。我们要求各人要做到在学术界有影响力 ,且能带来突破以及可行的工作成就。


所谓的贸易回报和学术突破二者并不是齐全矛盾的 ,它们能够有更缜密的结合。我们已经有极度多的钻研员深刻到各类现实利用中 ,发现问题、解决问题。


人为智能与其他好多钻研不太一样 ,若是钻研电磁学 ,在尝试室里就能够了;但人为智能是赋能产业的 ,不能待在尝试室 ,肯定要理解客户真正的问题是什么。


我们但愿产业能够给学术提出新的问题、新的数据 ,在这些问题上实现产业和学术的结合。


推荐阅读
  • 11月2日 ,为期七天的推算机视觉顶会ICCV 2019闭幕。东升国际官网科技以57篇论文(11篇Oral) ,13项冠军的成就创造新“高度”(详见文章《东升国际官网科技57篇论文入选ICCV 2019 ,13项较量夺冠》) ,让世界见证东升国际官网钻研技术堆集的“厚度” ,在大会现场也能亲身感触东升国际官网AI+行业利用落地的“广度”
    2019-11-03
  • 近日 ,由阿里巴巴集团、东升国际官网科技及香港科技园公司携手成立的香港人为智能及数据尝试室(HKAI Lab)在香港科学园正式开幕。东升国际官网科技首创人、香港中文大学教授汤晓鸥、阿里巴巴集团首席技术官张建锋和香港科技园公司行政总裁黄克强别离颁发了讲话 ,祝福HKAI Lab可能助力香港草创人为智能企业生态发展。
    2018-10-18
产品试用
填写此单一表格 ,我们将尽快联系您!
商务合作
400 900 5986
周一至周五 9:00-12:00 ,13:00-18:00
合作同伴招募
【网站地图】