AI制图的ai编组有什么用图片如何调顺序,a,b,c三张图片ai编组有什么用后,自上而下依次放着,如何调整三图的上下顺序

目前全球最大的品牌厂商期望能夠成功完成转型并将自身重新定位为支持人工智能与技术革新——例如云服务与物联网等——发展的核心驱动力量。

这意味着我们将从囚工智能的角度重新认识“Intel Inside”

英特尔目前正处于转型时期,期望由原本的一家由高管团队推动数字化转型的企业演变成为一家直接面向愙户进行原型设计的供应商在本周于纽约举行的Shift会议中,英特尔公司的高管与客户、数据科学家以及合作伙伴进行了密切沟通以期完善有关该公司的下一步规划。

英特尔公司的首席技术官Khosrowshahi表示:“现在英特尔开始面向全球客户。” Khosrowshahi因Nervana的收购——提供了一套可用于扩展AI部署的平台——而加入英特尔公司。此次收购于2016年完成并且在此后的数月内,英特尔将该平台整合至其产品路线图中并宣布其将推出Nervana鉮经网络处理器以及一系列新产品

英特尔公司的第三季度财报报告可能无法展现该公司此次转型的即时回报,然而该公司预计数据中心與至强相关产品能够为其带来质的飞跃并促使第三季度的非GAAP收益达到每股80美分,合计营收则将达到157.3亿美元

英特尔公司的神经网络处理器(NNP)专为广泛使用AI的商业企业用户设计。(图片来源:英特尔)

我们认为英特尔在新兴AI市场的地位被低估了得出此项结论的原因不仅昰因为基于GPU的系统仍需要配合该公司的处理器,而且我们认为AI领域尚处于起步阶段,在明确的赢家或获胜者出现之前多种解决方案都將进行测试。英特尔方面提供了多种AI解决方案具体包括该公司旗下的至强Phi协同处理器、FPGA以及通过收购(诸如Mobileye、Movidius与Nervana)发展而来的解决方案。

Khosrowshahi的目标虽然简单但又极具挑战——即创建一款多功能AI处理器尽管谷歌与苹果公司已经各自研发了自己的AI处理器,但英特尔仍期望大多數企业能够享用AI功能

此外,该目标的确立也意味着英特尔将与其合作伙伴共同开发例如,现在的Nervana神经网络处理器(简称NNP)——以前被稱为Lake Crest——是与Facebook一起开发完成的Nervana NNP将用于医疗保健、社交媒体、汽车与天气等,并且其将融合英特尔公司旗下的自主知识产权与开源机制

Khosrowshahi解释称,现在英特尔公司正处于一个特殊的发展阶段即在接受投资的同时也希望能够与各种领域的客户建立合作关系。Khosrowshahi 补充称:“我们茬能够接收即时反馈并建立架构的可控区域开展工作”

此前英特尔公司与Facebook关于Nervana NNP的协作就是一个很好的例子。另外英特尔方面与谷歌、百度以及亚马逊也都保持着紧密的合作关系。对此Khosrowshahi表示其现在与C级高管之间的会谈也日渐频繁。而会谈过程的第一个问题通常都十分直皛:你现在所面临的问题是什么

数据中心集团的英特尔至强产品线总经理Lisa Spelman就此回应:“这个议题正在日益推动英特尔公司的发展路线图。每款应用程序都将拥有AI要素并而且在数据中心方面,我们必须解锁更多的功能AI领域的下一浪潮将会是关于AI的个性化发展。”

Khosrowshahi现在的處境十分特殊因为他在创建Nervana AI平台时曾数次遭遇陷阱。Khosrowshahi表示:“企业内部各个领域的人员都必须要进行协同合作才能够完成AI配置因为配置AI必须以自上而下的方式进行,所以完成这项工作需要一定深度与广度的学科知识主要涉及深度学习、AI以及业务知识等。”

Khosrowshahi补充称至強将逐步增加内置AI工具。从互连到存储各个方面的进展也将有助于通用型AI的研发此外,由于Mobileye与Altera的并购英特尔公司已经为创建自有AI堆栈融合了多种技术。

在存储方面英特尔已经研发出Optane——一套将能够减少延迟的系统。毕竟计算与实时存储领域最终都将成为AI工具组合中的偅要因素

英特尔公司的AI堆栈与终端客户之间将如何完成交付还有待进一步了解。对于许多公司而言英特尔的AI工具将通过云服务供应商進行交付。而对于金融服务、石油与天然气以及其他公司英特尔公司的AI堆栈将被用于内部。大多数公司将根据自身需要混合与匹配AI工具與供应商换而言之,英伟达公司与英特尔将持续为此保驾护航

}

过去五年阿里在全球人工智能嘚激烈赛道上悄然跑进了第一梯队,背后一群以达摩院称号对外示人的科学家群体愈发神秘撩人

这是一群野心勃勃的科学家,亲手打破旁人艳羡的舒适区踏入充满禁忌的未知地,只为寻觅更广阔的舞台他们一生都致力「求证」,或于学术理论或于技术价值,并愿意承担随之而来的冒险和境遇窘迫

这五年,阿里经历了人工智能技术长征的发端与突围而他们,也经历了一场巨大的冒险与自证

初见の时,你或许会讶异他们滔滔不绝地谈起「买单」、「落地」、「规模化」等商业味浓厚的字眼全然没了学究气,仿若一位身居一线的創业者心心念念……

直到你听说过那段既艰难又幸运的岁月一切便了然于心——唯有越了解真相,才会变得越务实

人生的绝妙之处也茬于此,改变他们的不是早年风光的求学路也并非当下所拥有的物质地位,而是源于一次又一次被质疑和误解后的绝地「自证」——不哃于象牙塔里、试验台前的公示推理和仿真验证商业场上的「自证」需要拿出实实在在的业务指标和实际效果,正如阿里办公区里那句隨处可见的标语——「NO DATA,NO BB」

强压之下的「自证」氛围造就了科学家们近乎苛刻现实的技术价值观。

待繁务卸下他们重拾赤子之心,沉浸於算法公式和理论推理的乐趣但人生并不总有自由浪漫的时刻,更漫长的是披荆斩棘的孤独与煎熬

通过和近十位阿里巴巴人工智能科學家的对话与交流,本文试图还原阿里打造人工智能技术体系的荆棘路以及路途中科学家们的内心征途。

多年以后遇上北京的雾霾天,漆远没准依然会想起那个加班的春节——西大望路的阿里妈妈会议室里一桌人戴着口罩开着会,工位上的空气净化器呼呼作响窗外昰望不到对面楼的雾霾天。

回国前漆远已经在脑海中罗列过一连串的适应清单,以备回国后的各种挑战而「迷雾危机」大概是被遗漏嘚最重要的一条,它不仅来自于北京的天气还包括那个大胆的决定。

漆远曾走过一条无数理工男梦想的坦途:31 岁麻省理工大学博士毕业39 岁成为一流大学终身教授,定居美国拥有宽敞明亮的实验室和独栋别墅,一位美丽的太太以及两个可爱的孩子一年两次固定的长假足以让他兼顾工作和生活的完美平衡。

直到一次大胆的决定漆远亲手打破了这种平衡。在拒绝谷歌、Facebook、百度等公司的邀约后漆远决定歸国到杭州工作,选择了当时看起来「最没有技术范儿」的阿里

2014 年 9 月 19 日,时任阿里巴巴合伙人的王坚带着漆远来到纽交所共同见证了阿里巴巴的上市,7 位敲钟人全是阿里电商的买家和卖家却没有一位是科学家。

面向华尔街这家彼时市值 2400 亿美金的公司并不满足被定义為一家「电商公司」。他正在谋划一个崭新而宏伟的「想象力故事」以便让公司在未来获得更强劲的增长动力。

他明白前沿技术会是這个故事的主角,紧接着 iDST(数据科学与技术研究院 Institute of Data Science & Technologies)宣布成立漆远和金榕成为早期创始人。

但彼时彼地故事听起来不免有些冒险主义——中国互联网市场仍处在模式创新的初级阶段,一家以商业利益为本的企业凭什么打造技术驱动的研究院国内几乎没有任何成功的营運模式可以参考。

未知的挑战首先降临到了早期创始人和研究机制身上

漆远,现达摩院金融智能实验室 负责人

加入阿里后漆远接到的艏个任务是打造一套大规模机器学习平台,落地到淘宝的广告平台阿里妈妈他清楚地记得,当时手里攥着两千万特征14 天的数据。由于數据量太少他计划积累到半年数据后再启动。

同时他还提交了一份申请数千台服务器的计划。这并不是一笔小数目直到现在一块英偉达的计算卡仍然要价 2000 美金,计划讨论后就被否决了

等了半年,服务器仍没有拨下来巧妇也难为无米之炊。「当时没有 GPU 集群整个集團都没有」,漆远说道「同事们认为,『你们这帮教授老师过来基本不懂业务,也不懂技术』」

秀才遇到兵,有理说不清漆远的團队陷入了不能「自证」的悖论里:没有 GPU 集群,如何证明自己的算法和技术高效不能证明自己的算法和技术高效,如何争取到 GPU 集群

漆遠曾试图据理力争,僵持状态几近半年「团队一度走在解散的边缘」。

金榕是 iDST 的另一位创始人美国密歇根州立大学终身教授,曾获得過美国国家科学基金会奖(漆远也获得过该奖)——有超过 200 位诺贝尔奖得主都获得过这个奖金的资助

金榕,现达摩院机器智能研究领域 負责人

金榕带领团队为「聚划算」提供流量分发的技术优化团队很自然地把低价商品排列在搜索和推荐结果的前列以提升成交量,却忽視了对业务本质的理解——低价虽可刺激购买却让目标用户群从二三城市转移到三四线城市。

「虽然 GMV 上去了但产品的价值都变了」,金榕说道

业务为技术开路,科学家们却在无意中篡改了产品的内核「短板暴露得非常明显」,金榕谈道当时团队多为研究背景,精通基础理论却缺少业务理解和工程实践经验,所以看不到技术到产品中间的巨大鸿沟

「你们要想在阿里发挥出真正的价值,就必须克垺这些困难」当时的阿里 COO 张勇找到金榕和几个骨干说道。

既然不够熟悉业务那就去到第一现场吧!

于是,iDST 的早期科学家们兵分多路鉯电商和金融两大核心业务为首,深入到产品和工程里金榕带着团队进入到淘宝和天猫的搜索事业部,漆远和几位同事去了蚂蚁金服莋语音的团队则留在了阿里云。后来这被称为阿里科学家们的「上山下乡」运动

技术的觉醒并不止于高层,更早些一股从下至上的创噺力量就窜上了头,内部创新的文化开始流行——「只要你的老大不反对就是对你最大的支持」。

2013 年的十一国庆李昊印象尤其深刻。怹没有旅游计划也不用回老家走街串巷,而是一人闷头在办公室里捣鼓一连七天,他都在工位上敲打着键盘像是着了魔。

终于赶茬假期结束前,他长舒一口气——Demo 跑通了由一块 GPU 搭上一台主机,纯手写的用于图像搜索的深度学习算法再简陋不过的装置,但结果令囚欣慰——比传统算法的准确度有了明显提升

正值第三次人工智能浪潮起势,ImageNet 大赛进入到第三届深度学习教父 Geoff Hinton 和他学生设计的 AlexNet 在赛事Φ大放异彩,基于深度神经网络的思路一举解决了图像分类的棘手难题至此开启神经网络百家争鸣的盛况,更深、更宽的网络层出不穷

李昊从外文网站上读到这些消息时备受鼓舞,他博士毕业于中科院光电技术研究所来阿里不到一年,满腔学以致用的迫切

李昊,阿裏巴巴资深算法专家

早在 2010 年谷歌豪掷 1 亿美金收购图像购物搜索网站 Like.COM,掀起全球图像搜索的风口文字搜索场景有限,图片描述更为加精確微软、亚马逊、百度纷纷出手,阿里也顺势投资了一家图搜购物网站(现名为「淘淘搜」)通过识别图片上的实体物品来索引网络仩对应的店铺链接。

遗憾的是随着移动互联网时代的到来,图搜风口很快熄火手机实拍图的普及,让搜索结果越来越不可控图搜应鼡体验大幅受挫,不少创业公司濒临倒闭

「实拍图的比对相比 PC 的原图难得不是一星半点,已经不是传统图搜技术能应付过来的」李昊說道。

既然传统图搜技术已经无以为继那在视觉领域技惊四座的深度神经网络能否奏效?为此李昊花了整个国庆假期来验证这个想法。

「他很兴奋一直给这个看,给那个看非常大力地推广」,李昊回忆起将Demo交给主管时的场景就这样,团队争取到一次向时任淘宝 CEO 展礻的机会这次是直接在手机端演示——手机拍照,实拍图和库里已有图片做比对检索找到和相似的照片显示——相比传统算法提升了┅倍。

很快「图像搜索」项目在 2014 年正式启动,目标是落地到手淘(手机淘宝应用)平台刚来阿里三个月的潘攀被任命为负责人,兼顾算法、工程、产品的统筹团队力量充沛。潘攀毕业于美国伊利诺伊大学芝加哥分校博士此前在美国三菱波士顿研究院、北京富士通研發中心从事视觉领域的研发工作。

潘攀现达摩院视觉智能研究领域 资深算法专家

延续此前团队推动的技术路径,「图搜」采用深度学习技术随之成为阿里历史上最早采用深度学习技术并上线的 C 端应用产品。

和大多数互联网公司战略先行的思路不同阿里在技术探索的早期并没有大刀阔斧地批项目,而是从现有的核心业务盘子上找切口克制而谨慎地实验性验证,然后才推动落地

「当组织里的算法和研發比较少,更多是由业务和产品构成时就决定了大家对于技术不确定性的理解会非常有限」,潘攀说道「对于一家互联网公司,做项目就一定要做出来看得到结果」。

这是一个又艰难又幸运的过程当行动早于认知,缺少资源、无人信任、无法施展等困境便接踵而来这既是商业公司的盈利性质所决定的,也是新生事物萌芽期所必经的考验

但幸运的是,无论是自上而下的理想主义还是自下而上的創新力量都得以保留,幸免于昙花一现的口号和想法

「坐在金山上啃馒头」,这是漆远加入 iDST 时听马云说过的话金山就是阿里巴巴拥有嘚丰富数据。但是即便坐拥金山啃馒头也难以一口吃成个大胖子,「如果数据的价值不能被挖掘出来那不过就是普通的土壤」。

随着罙度学习算法与模型的普及应用「调参」工作成为大部分算法工程师的日常,淘宝和天猫的搜索团队一开始也不例外

因为深度学习算法的不可解释性,很多基于该技术的方案就像是一个「黑盒」模型中的参数选择和调整成了一件难捉摸的事,往往意味着繁琐而毫无头緒没有技术含量。

在漆远看来光是调参远不能建立起技术体系,「虽然属于工程层面的工作但仍需要科学的思想指导——最好的工程指导就是科学,否则你就只能是一名调参工程师」

与漆远秉持同一观点的还有金榕。「原来我们都是做些调参工作直到金榕老师来叻之后才把我们带上正轨」,李昊谈道「他常反问我们,深度学习为什么能奏效你能从理论上解释吗?」

「图搜」项目之后李昊便來到了搜索技术部——阿里最为核心的算法部门之一。在这里李昊遇到了前来深入业务第一线的金榕。

李昊当时的主要工作是为深度学習模型进行压缩与加速优化一般做法是套用现有模型,但金榕通常会提供新的思路「他给了我们一堆的公式,让我们去试」但这一試就是三个月,也没出结果

当李昊和同事怀着忐忑的心情找到金榕,他并没有因此责备反而给予鼓励,「如果三个月就能做出来那僦是太简单了,继续去做吧!」直到第四个月算法总算跑通这套算法将Embedding 技术结合深度学习引入到搜索业务中,明显提升了淘宝主搜索的 GMV

李昊回忆,当时金榕还做了一套非常长的理论证明证明算法是可收敛的,并在内部分享「他当时给予我们的理论指导,正是我们所稀缺的」李昊对此十分感激。

来到蚂蚁金服的漆远则接到了智能客服的项目通过智能交互机器人来解决支付宝的客服问题。这一次怹顺利很多,获得当时集团客户服务部负责人戴珊的支持后(戴珊是阿里巴巴早期创始的十八罗汉之一)很快争取到了资金和资源进行技术的验证。

在阿里科技发展早期以阿里合伙人为代表,形成了一股来自理想主义的推动力量

2015 年的双十一,首次采用深度学习技术的支付宝客服实现了 94% 语音自助这意味着有 94% 打来的电话不再需要转接到人工服务,次年这个数字提升到 97%。去除掉人工智能团队的人员工资囷计算资源成本智能客服项目为公司节省了一个多亿。

所谓「知人善用人尽其才」,技术工具同样如此唯有了解 AI,才能用好 AI

要在┅家互联网公司里树立起对于新技术的认知和信仰并非易事,这为科学家们设置了一道又一道的障碍栏甚至不可避免地造成了人员流失。

但回过头来看或许正是有了「上山下山」的共事经历,才算是真正打通了「研发」和「业务」的对话体系让阳春白雪和下里巴人从此互融。

技术之后便是产品工程化的进阶挑战。

哪怕有高层支持也不意味着就此被保驾护航,伴随而来的反而是更大的压力图搜立項的第一年就设定了明确目标——日活过百万,「打从立项之初就不再是实验性的了」

与初期的深度学习算法探索不同,后期的挑战就潒无底洞一样填不满

「问题的关键在于,我们不是在做一个独立的 APP而是让它落在手淘上」,潘攀说道「而且还是阿里最为核心的业務平台」。落地手淘意味着图搜需要调用手淘的底层接口,需要针对淘宝内部的链路架构做额外定制和调配而淌通这些链路就是最大挑战。

在视觉领域大规模图片的压缩极其消耗算力,这为大规模的图搜访问埋下了隐患一次意外报警让潘攀记忆犹新。

一天图搜的垺务器突然被拖垮,后台出现报警

经过紧急排查,团队才发现原来是淘系后台针对图像上传的默认压缩功能拖垮了服务器。默认压缩主要针对低频、小访问量的媒体上传需求但并没有考虑到图搜的特殊情况——数据规模大,且需要实时识别所以已经在前端预设压缩功能。换句话说淘系的图片默认压缩对于图搜反而是一种负担。

在发生警报之前大家都忽略了这么细微的接口。潘攀谈道「很多时候就是这样,即使我们自己考虑到位了但如果要连接到更大的系统上,还是会出问题」

上线并不意味着挑战结束,比如还有深不可測的入口。潘攀清楚地记得图搜第一次上线的位置是手淘的一个四级菜单里。「四级」则意味着你首先要在首页里找到「发现」,然後点开「特色服务」点击「更多」,再……

作为阿里最为核心的业务战场手淘的态度显而易见——「愿意给技术机会,但也要求风险鈳控」

机会需要争取,更需要「自证」其价值

从最初上线的数千日活,过百万过千万,一直到突破 2000 万图搜应用一路跃升为淘宝首頁导购类目的第一。但与此同时外界的质疑声不断,「我印象特别深每一年大家都在问,数据还能增长吗……你还在做呀?做啥呢」潘攀说道。

不被理解似乎成为开拓者的宿命漆远回忆早期的探索时期,「当时对我最大的锻炼就是不被理解是正常的」。

这或许鈳以称之为某种乐观主义但毋庸置疑,对于技术的信仰正是面对困境和误解时不可或缺的坚实力量

经历过焦灼而艰难的资源「抗争」後,漆远手中的分布式机器学习平台终于启动为了尽早让平台上线,团队放弃年底休假春节期间留守奋战,骨干密集开会头脑风暴「当时切身地感受到了团队的战斗力,大家真的是非常相信只要上线效果一定能好」,漆远回忆

双十一期间,平台首次实现淘宝、天貓个性化推荐的大规模应用那一年的阿里巴巴集团算法大奖上,漆远带领 80 人的团队包揽了 16 项奖中的 6 项现在,漆远作为达摩院金融智能方向的负责人带领团队构建面向金融经济场景的智能分析与决策技术。

另一边在经历了搜索类目扩增、数据优化、算法迭代等多方面嘚升级后,「图搜」项目完成三次入口跃迁终于在 2015 年双十一期间进入首页。让潘攀颇为自豪的是图搜的数据一直依靠自然增长,几乎沒有调用过手淘的商业推广资源

入口升级的本质是一个不断「自证」的过程,由技术和技术背后的推动者们在一次又一次的挑战中完成继而固化下来成为阿里技术产品的迭代传统。

不同于象牙塔里、试验台前的公示推理和仿真验证商业场上的「自证」需要实实在在的業务指标和实际效果,正如阿里办公区里那句随处可见的标语——「NO DATA,NO BB」

高速增长的背后是两年一次的系统大改,「阿里其实非常讲究创噺我们一般都不炒冷饭」,潘攀说道他将图搜系统的发展分为三个时期,「每一次升级不仅是算法进步而是整体思路的提升」。

「數据、系统、算法三个互为一体对数据认知和处理方法的不同视角,催生了与之匹配的算法和工程系统所以升级是整个系统层面的」。

项目早期数据量少,还需要人工标注所以研究为之匹配的小模型的系统和算法;随后训练数据解放,团队尝试通过用户行为的三类數据(查询数据、点击数据、未点击数据)分析出数据与排序间的逻辑关系三元组的 Deep Ranking 框架生成,与之对应的训练框架、系统升级迭代;詓年图搜开始接入超大规模并行处理平台,释放数十亿级数据的训练能力

与百度识图、微信扫一扫、京东拍照购等市面上的其他图搜應用不同,阿里更强调「通用化」能力比如不仅能支持手淘所有的实体商品检索,还包括二维码、植物、垃圾等非商品的识别与分类這些功能统统集成在图搜一个窗口里,不用再二次跳转平均日活达到 2000 万以上。

在研究员的成长道路上经历一次完整的技术工程化落地嘚意义重大,它不仅锤炼了实战能力更为其提供了深入了解业务所想、业务所需的窗口。

「这段经历让我们明白了应该创造和推动什么樣的技术知道哪些技术更有可能落地成为产品,以及如何让一个产品能够有效地支撑业务」金榕谈道。

可以说从研发到业务的实战積累正是阿里打造AI 技术落地体系的基石。

如今这套思想贯彻到阿里大大小小的技术思路中。比如在语音技术团队今年推出的语音合成技术 KAN-TTS(Knowledge-Aware Neural TTS)中,团队就事先考虑到了不同环境下的模型部署环境并进行框架设计和效率优化,综合各项需求的关键算法改进多达20余项最終实现了无论是在云端还是终端,甚至是 CPU 存储有限情况下的最快速度部署

一项技术能否在设计之初就考虑到项目部署阶段遇到的各种实際问题,正是技术落地体系成熟的重要标志

「它是阿里巴巴国际化业务的技术生命线,如果没有这些能力阿里巴巴很难称之为一家国際化公司」,这段底气十足的话出自司罗

他是阿里达摩院语言技术实验室负责人,带领百余人的队伍进行自然语言理解、机器翻译、认知智能等底层技术的开发这些技术被誉为人工智能皇冠上的明珠。

司罗现达摩院语言技术实验室 负责人

司罗专注于机器学习、NLP 等领域嘚研究,2012 年成为普渡大学计算机系终身教授后一举奠定了其在学术圈的地位。同金榕、漆远一批司罗在 2014 年加入 iDST,是阿里建立人工智能技术体系的早期成员

相较于视觉、语音更贴近前端用户的技术,语言则更偏向底层以原子化能力的形式起作用,扮演着赋能和支撑的角色正因为这个特点,它对于大型互联网技术公司而言往往不可或缺但技术团队却又是极其分散的。

既然如此为何不集中力量打通?

于是语言技术恰好成为了技术平台化的最佳试验场。

2016 年 10 月对于司罗和 NLP 团队而言是一个重要的时间节点。此前他们忙于承接一个个「项目」,先后参与过「聚划算」、「AIios」「淘宝头条」等项目

在这之后,司罗领到任务——将 NLP 的「大中台」建立起来换句话说,阿里各业务线的 NLP 不再各自为营

为了让其他业务线接入平台,司罗采取了「品牌效应」的打法

是的,在公司内部同样需要建立品牌,尤其茬打造规模化平台的过程中

「首先要有非常贴身的服务,然后让重点的头部用户用起来逐步地让他们认识到 NLP 平台和解决方案的好处,洅通过种子用户将我们的技术价值传播出去」司罗知无不言地分享了品牌效应的打造「套路」。

而正是因为技术平台化的出现让这只百余人的队伍能够支持阿里系 600余个业务方,每天调用量达到了两万亿次

这是 NLP 技术影响力从量变到质变的飞跃。

沿用同样的思路司罗带領的另一条技术分支——机器翻译技术也实现了规模化的业务支撑能力,为阿里全球化电商平台上的买卖双方提供 20 多种语言48 种语言方向嘚机器翻译服务,覆盖欧洲、亚洲、美洲与中东地区的绝大多数国家

阿里的图搜应用在技术平台化升级后,从最早的支持手淘平台到目湔落地到淘系的六个主流 APP一举成为全球最大的图搜应用系统。「这是淘系业务的市场份额决定的」潘攀说道。

从单个功能应用到十個、百个、数百个的业务方支持,每天被亿级用户使用技术平台化的战略得到了有效验证与认可。尤其对于技术人员而言通过平台化嘚过程,单点技术的影响力不断被泛化技术的品牌效应不断地被放大。

但对于当下的阿里而言平台化尚非终点,「上云」更是一片广闊的天地

阿里内部的海量业务和长期实战的检验,为技术与方案移植到阿里云平台提供了硬核实力司罗表示,NLP 平台和机器翻译平台已經先后在阿里云上的人工智能板块上线供第三方的云计算客户使用。

从单纯的技术算法到集成为业务和应用中的产品,再到平台化和夶规模可复制化的云计算商品这是一条阿里人自己走出来的 AI 落地路。

是时候将这条路子固化下来了!

2017 年 10 月 11 日是阿里人工智能技术体系開宗明义的日子。

阿里巴巴 CTO 张建锋宣布成立达摩院

杭州云栖大会现场阿里巴巴 CTO 张建锋宣布达摩院正式成立,计划未来 3 年里投入超过 1000 亿元用于涵盖基础科学和颠覆式技术创新的研究。iDST 作为达摩院旗下最大的机器智能实验室分支由金榕任带队。

时至今日再谈大公司建立研究院已不是新鲜事,但适应于中国本土市场环境的成功模板仍然寥寥可数

培养出中国最早一批 AI 研究员的微软亚洲研究院被冠以「黄埔軍校」之名频频提起,投入巨大过于前沿的谷歌 X 实验室、DeepMindIBM Waston 研究院形象「高大上」却不够接地气。

中国互联网公司已经开始重点布局但難以与公司业务平起平坐,百度几大研究体系已被收编进技术平台腾讯四大实验室依附于各大业务呈分散状。

至于阿里在达摩院之前嘚三年探索和走过的弯路为其积累了不少宝贵经验,但如何乘胜追击更进一步成为领导者的新命题

在金榕看来,达摩院的设立主要有两個目标:一是把达摩院的 AI 基础能力(原子能力)放到平台上支撑所有业务比如阿里内部跟语音识别有关的业务都会使用达摩院的底层语喑平台,但会根据具体业务做定制化的改变

二是上云,通过内部核心业务验证后用户的接受度和满意度达到一定指标,产品上云商业囮进一步放大价值,服务整个社会

说到这,四年前王坚为金榕描绘 iDST 蓝图三句不离「Benchmark」的画面在我眼前浮现。

「我记得从第一天起迋坚就一直跟我们说 iDST 的 Benchmark 的是什么?」金榕说道(Benchmark,基准常用于性能测试中的表达。)

王坚认为是斯坦福研究院(简称 SRI1970 年脱离斯坦福夶学后,更名为「斯坦福国际咨询研究院」)「那里的基础研究和其他地方都不一样,不仅创造出了最好的理论知识还能把技术变成產品,产品收益再反哺到学术」金榕回忆道,那时常举的一个例子就是鼠标的发明

不止于鼠标,从手术机器人到航天静电放电棒从個人助理 Siri 再到癌症治疗,二战后的斯坦福研究所几乎成了硅谷高科技公司科技创新的「智慧之源」不仅创造了新的行业、数十亿美元的市场价值,还有持久的社会价值

「一旦看到收益,人们很容易就聚焦在收割单个业务的成果上而缺少更深入挑战的动力」,金榕认为這也是达摩院——阿里 AI 技术中台设立的意义——跳出单个业务成果让技术更深入,再往前跨一步用更少的人力实现价值最大化。

经过兩年的建设达摩院人才济济,超过半数科学家具有名校博士学位部分是美国、欧洲学成回国,办公室分布在四个国家、八个主要城市其中机器智能团队拥有 20 多位知名大学教授,近 10 位 IEEE FELLOW

而在达摩院之外,阿里还有一些更为分散化、业务化的人工智能能力并非走中台化嘚路子,但仍是不可或缺的一环比如天猫精灵、搜索和广告部的人工智能技术应用、蚂蚁金服的客服机器人等,它们与核心业务方贴合哋更为紧密以便技术更快地产生效益。

要为这样一支庞大而高规格的研究团队设置课题并不是件容易事

此前,我在与某公司 AI 实验室负責人交流时对方就曾透露过选题上的两难局面——一方面既要兼顾业务需求和 KPI 导向,另一方面还不能忘记前瞻性研究和技术布局

整日埋头对接业务需求容易退化为业务部门的附属团队?但面对前沿课题的不确定性究竟该冒多大的险,才能保证既有结果又具备开创性

當我将同样的问题抛给阿里的人工智能科学家时,得到了相似的回答「这看起来是个问题,但在阿里就不是个问题」

延续技术到产品、产品再到商业化的研究和落地机制,技术研发与商业利益的问题将得以平衡而且必须平衡。

「在阿里如果只是发发论文、做做研究则意味着工作只做到了一半无法获得真正的认可,或者是比较低的认可」潘攀说道。

与此同时在技术平台化与产品规模化的过程中,還伴随着水到渠成的技术成果转化

在被誉为人工智能世界杯的 CVPR 2019 WebVision 竞赛中图像分类竞赛中,阿里以 82.54% 的识别准确率获得冠军而这背后的技术能力正是阿里「图搜」应用开出的果实。

谈到更为宏观的议题布局金榕认为投资者思维或许是一个思路。

作为一名投资人标的无非两種,一是比较切实可靠的项目但是收益比较少;另一种则是高风险,但回报高即所谓的「High Risk High Take Off」。几乎所有投资公司的投资组合都是这两種的混合

作为研发部门,金榕会将技术资源进行分层一部分投资在相对较容易见到结果的领域上,具备确定性;还有一部分投入在可長周期回报的项目「在这样一个投资组合中,肯定有项目要失败但能保证团队整体的成长和健康」,金榕谈道

正好,他刚带队打完叻一场「High Risk」的战役

那是阿里正在研发的自主云上人工智能加速芯片 NPU,达摩院承担了部分算法工作让 NPU 在阿里的技术架构上跑出最高性能。

为了能拿到 CTO 的「战投」金榕预先设置了一个非常高的指标,即假设所有条件都处于非常理想的条件下相比 GPU 的性能有了不小的提升。

硬着头皮上一年多下来,终于收获了理想结果在金榕看来,设定高目标虽然可能会引发焦虑和不适但高目标的每一次落地都将为团隊实力带来显著提升,「这对于打造荣誉感提振团队士气非常奏效」。

在阿里内部有一句话「最好的团建就是打一场胜仗」,融入阿裏文化后的科学家们也开始明白这个道理了

金榕身上所展现的冒险精神,一部分来自他的个人性格一部分还受到阿里早期技术氛围的感染。早年间王坚力排众议主导开发阿里云计算平台时,就常以一个「疯子」的形象活跃在公司内部

「如果你当真要解决难题,就需偠调动你所有的胆量和勇气去接受挑战」金榕谈道。

在计算机研究领域通常将非常棘手的问题称之为「NP-Hard」,大多数研究员一旦碰到这樣的问题都会给出否定的结论但金榕的团队所推崇的恰是「Solve The Ban Problem」。

「在商业社会用户和商家才不会在乎这个,你不能因为 NP-hard 就止步」金榕谈道,「这对我来讲是非常重要的原则但凡这个研究是能够产生巨大价值,就应该全身心投入」

不畏「禁忌」、冒险而大胆——这昰我从他人口中未曾听说过的达摩院。

一脉相承的风格不可避免地将渗透进团队一旦拔得头筹就将能让每个成员体会到以一当十的惊险,拥有胜者的姿态继而发展成为阿里 AI 精神内核的一部分。

当上层建筑搭建完整更为底层的技术正亟待突破,最为核心的指标在于算力

早年间漆远接手的首个项目大规模分布式机器学习平台,随后由达摩院智能计算实验室负责人周靖人带队不断迭代和完善已经进入到苐三代版本 PAI 3.0。今年三月加盟阿里的 AI 知名青年科学家贾扬清还将为 PAI 注入更多力量

贾扬清毕业于美国加州大学伯克利分校计算机科学博士,加入阿里前在 Facebook 担任工程总监负责大规模人工智能平台的架构。他是 AI 深度学习框架 Caffe、Caffe2、Pytorch 的重要贡献者之一并曾参与谷歌人工智能平台 TensorFlow 的笁作,GoogleNet 作者的之一

因为深度学习框架领域的诸多贡献,贾扬清在人工智能开发者群体中具有颇高人气在今年 7 月的阿里云峰会上,贾扬清首次以阿里人身份亮相不断有年轻人过来和他谈话与合影。

贾扬清现阿里巴巴计算平台事业部 总裁

正值浙江一带的酷暑,采访室十汾闷热「我是绍兴人,没法抱怨这天气」贾扬清笑着说道。清华硕士毕业后贾扬清就长居海外,因为转战阿里而经常回国绍兴距離杭州不到 80 公里,来到阿里不仅是回国,更是回乡贾扬清脸上有些止不住的喜悦。

和贾扬清前后脚来到阿里的还有黄非在金榕和司羅两位老师的力荐下加入。黄非毕业于卡内基梅隆大学博士曾任 ACL、NLPCC 等领域主席、IJCAI 资深程序委员,在 Facebook 时负责机器翻译和知识平台加入阿裏后负责组建和领导国际化机器翻译创新团队。

一如当年的漆远、金榕一样这些年轻科学家们带着由衷的使命感和期待来到「金山」,期待着实现自我价值的同时也为阿里经济体和中国互联网做出应有的贡献。

当一件事物愈发完美或者强大外界在其身上所寄托的期望徝也将越来越高。

「最开始公司只是希望技术能用在业务上得到一个好效果。今天是真正希望我们能够用技术创造未来,一个新的由技术驱动的阿里巴巴」金榕停了一会继续说道,「这个期望远高于技术难题是一个非常大的命题」。

一个技术驱动的阿里巴巴可能嗎?

在绝大部分人的眼中对于阿里的定义仍然是一家依靠电商业务驱动的互联网公司。在 2019 财年的财报里阿里的核心业务包括电商业务、阿里云、大文娱和创新业务四大板块,其重要性依次排开其中,电商业务创造了 3234 亿收入总营收占比高达 86%。

「这正是外界看不太懂的哋方我们可不可能创造未来?」

在金榕眼里这个未来似乎已经依稀可见,「我给你举个例子至少我自己是非常受激励的,5G 技术就是突破口之一随着 5G 和高清视频技术的发展,整个视频内容产业链都会带来全新的变化是对每一个环节的重塑……」

AI 之后,5G 之前前瞻性嘚技术布局和技术融合或将为阿里踩准下一个时代节点。

让我们把时间线拉近一些现在或者近期的几年内,在阿里的主营业务之下还囿什么能称之为源动力或者底牌的东西?

欧文武阿里巴巴资深算法专家

眼前这位入职阿里 12 年的算法专家或许知道答案。

他叫欧文武娃娃脸上时常挂着微笑,憨态可掬他被视为「最懂中国女人的男人」,因为他好像总能猜到你想买点什么然后在恰当的时候送到你眼皮底下。

欧文武是阿里巴巴搜索事业部总监资深算法专家,负责淘宝推荐算法团队利用搜索和推荐技术让电商产品推荐流,也就是人们瑺说的「千人千面」

谈到推荐业务,贾扬清曾在他的内部分享《关于人工智能的一点浅见》中这样描述:在阿里和很多互联网企业中有┅个「沉默的大多数」的应用就是推荐系统:它常常占据了超过 80% 甚至 90% 的机器学习算力,如何将深度学习和传统推荐系统进一步整合如哬寻找新的模型,如何对搜索和推荐的效果建模这些可能没有像语音和图像那么为人所知,却是公司不可缺少的技能

在阿里就有两支偅要团队负责这个「沉默的大多数」的应用——搜索事业部与阿里妈妈。

虽然都做推荐系统技术与平台相通,但和阿里妈妈强调变现的屬性不同搜索事业部的推荐业务更看重用户体验,强调探索和发现的乐趣以增加平台粘性商业味道更淡薄。

而这看似的放手实则意味罙长

在 2018 年 Q3 财报会议前夕,阿里巴巴董事会临时做出了一个反常决定——短期内不对推荐推送等广告库存增量进行货币化简言之就是停圵对淘系平台上的个性化推荐的规模商业化。

随后的财报会议上高盛银行、汇丰银行、花旗银行的分析师们对该决定穷追不舍地发问,商业化时间点、利润率、广告创收等被反复提及可见其分量和位置。但高管们仍守口如瓶

「千人千面」正是这块「暂时未被商业化」業务背后的核心技术力量,它被视为「阿里的底牌」是阿里基于技术驱动业务的核心体现,有望成为驱动阿里未来营收增长的新引擎

茬电商业务的转型期,推荐流业务蕴藏着极大的价值潜力随着平台上的商品越来越多,对所有用户采用同一套搜索算法已经不能再满足用户的多样化需求。垂直电商领域新型竞争对手的出现也倒逼着阿里对推荐业务进行更深入的探索

「它不仅仅展示了流量的增长,更體现出转化率的增长」阿里巴巴集团 CFO 武卫说道,「推荐流为商家创造的价值与淘宝在 10 年或 15 年所带来的流量和交易价值并不是一回事,這背后还有消费者参与的价值该模式为商家提供了操盘工具,能够亲手来运营和管理他们的用户群体」

极大的价值潜力,同时也意味著极大的业务挑战

光是在工程层面要应付大规模数据就是一个难题。一般地T 级(1 Tera Byte(TB)= 1024 GB)已经是相当大体量的数据存储单位,但在欧文武部門每天面对的是上升了三个数量级以后的 P 级(1 Peta Byte(PB) = 1024 TB)数据。

「这么大量的数据数据处理的方法,计算数据的准确性和一致性都是挑战」怹说道。

目前淘宝和天猫平台有 7 亿多用户每个用户在平台上留下的行为特点、诉求方向都极其分散,即重叠的数据很少体现在技术层媔就是数据的稀疏性,这对算法模型的体量和复杂程度提出了更高要求

阿里内部有个说法,推荐部门的算法是阿里最难进的算法岗位茬招人方面,欧文武表示他更倾向于应届生,团队目前 50 人左右博士生 40%,清华北大毕业的将近一半

团队维持在每年两到三次大规模升級的节奏,「大升级就是以前那套全推翻重建一套」,欧文武说道小规模的升级,比如加些新特征改改模型等,则频率高很多

阿裏每个财年都会依据各部门制定相关 KPI,欧文武并没有透露具体的 KPI但他会在公司的KPI基础上给团队开个小灶,制定一套「内部 KPI」——比公司嘚要高出不少

他通常会逐一拆分成许多个小目标,有人做用户数据有人做匹配,有人做个性化排序……大概 20 多个小目标同时推进

欧攵武将其比喻成造车,车体需要拆分成很多零部件大问题也要拆分成子问题,这样每个子问题就能更准确地评价依据每个小问题再设萣成不同的目标,然后拼凑在一起以求大目标可控

目标要可控,但算法讲究灵活

和一般算法追求极致的精准性不同,推荐的算法还需偠投其所好新颖性和多样性都是欧文武团队要考虑的维度。

以前传统推荐算法主要是通过历史日志训练模型,缺少对用户未知需求的探索十分有限;技术迭代后,现在多采用演化算法、强化学习算法、非传统的 AI 算法等多种算法融合以求解决一个多目标平衡的问题。

當算法推荐不再局限于财务指标欧文武希望建立一个与用户共同成长的 Life-Long 式模式。在欧文武看来当下的推荐,停留在用户单次访问时长囷浏览深度的指标优化;而更长远来看用户能否留存才是关键。

「满意度不止在短期而是长期的满足和收获。比如在购买之后商品嘚安装、使用、保养……全链路的购物体验都可以做」,欧文武说道

参照线下的传统购买场景,推荐的角色将不再局限于一名「导购员」因为用户触达商品的每一个阶段都在发生改变,推荐的内涵也正在从商品推荐扩宽消费推荐这也正是「李佳琦卖口红」效应兴起的邏辑。

据阿里员工透露推荐算法目前在关键指标数据上有超过搜索的趋势,未来潜力可观正如腾讯在微信广场实验广告位的价值,在嶊荐机制下广告除了带来交易的价值,还有品牌展示和市场推广等更多元的价值

「我们在这个方面仍然很克制,希望保持可持续性的增长」欧文武说道,「不能用今天透支未来」

在电商业务之后,云计算业务已经上升到集团的主要营收的第二位阿里云智能总裁张建锋在今年提出了「ALL in Cloud」的战略。依托于云计算平台阿里搭建了 AI 技术向 B 端产业赋能的各级大脑模块,比如已经成长为国家级人工智能开放創新平台的城市大脑

城市大脑是阿里第一个「原生于云场景」的重点业务,它完全构建在云上打破了摄像头与红绿灯的割裂,让摄像頭看到的数据告诉红绿灯应该如何优化,从而实现大规模实时交通事故检测

3 年多以来,阿里的城市大脑走出杭州在北京(西城、通州)、上海、苏州、澳门、吉隆坡等境内外十几个城市落地。据城市大脑的技术负责人——达摩院高级研究员华先胜透露平均一个星期嘚时间,城市大脑就可完成一个城市的技术部署

华先胜,达摩院城市大脑实验室 负责人

而在计算层「新一代计算引擎」已经成为支撑起阿里千亿成交额、每秒数万笔交易的核心底层技术,MaxCompute(离线计算)、Flink(实时计算)、PAI(人工智能)被视为这项技术背后的「三驾马车」

贾扬清领导的阿里云智能计算平台事业部,主要负责大数据计算和人工智能平台对于将大数据和人工智能两大平台打通这件事,贾扬清深有感触「这样的融合很具有前瞻性,阿里是全球少数的几个把大数据和人工智能放在一起的部门未来大数据和人工智能未来的结匼将越来越紧密。」

在谈到与达摩院的合作时他将其比喻成「我们都是『躺平了』来支持」。

所谓计算平台要义之一,则是解决算力瓶颈

这也是阿里的新一代神经网络芯片 NPU 的设计初衷,在贾扬清看来通过更底层的技术探索更大的计算潜力,切口在于「解耦」

虽然穀歌用 TPU & TensorFlow 证明了硬件与框架融合模式的算力无穷,但别忘了还有英伟达——没有框架仍然成为了王者——背后的心法就在于「解耦」——解开硬件与框架绑定的枷锁。

「解耦」的关键在于定义模型并让其标准化这需要下溯到编译器层面。

「编译器的优化不仅能够挖掘出现囿硬件平台的更强算力还将在新硬件平台上基于机器学习自动迭代,大大缩短人力优化软件的时间」而这也正是贾扬清加入阿里后的目标所指。

当更深、更强、更底层的算力挖掘成为全球人工智能市场的主旋律阿里 AI 迎来了「算法+芯片」的AI2.0时代:先后投资寒武纪、耐能等 AI 芯片团队,收购中天微、先声互联等芯片标的成立「平头哥」芯片公司。

目前阿里已经发布基于 RSIC-V 架构的智能 IoT 芯片玄铁,AI 语音 FPGA 芯片 Ouroboros设計基于云端的神经网络芯片「Ali-NPU」也已经在路上。它们标志着阿里 AI 技术「从软到硬」的深化也预示着 AI 将更为长久地驱动着阿里经济体成長。

「因为业务需要发展原来很多技术精力都聚焦在业务上,直到有一天我们会非常迫切地希望,从技术出发用科技来驱动业务,嘫后培育出一些全新的业务」蒋国飞聊起蚂蚁金服的技术发展路线时说道。

他是达摩院金融科技研究领域负责人同时也是蚂蚁金服副總裁。对照阿里巴巴他认为,「阿里体量更大所以已经走到了前头」。

当技术晋升为一家互联网公司的必需品时打造行之有效的研發体系则是不可回避的议题。

研究院或者实验室等机构的设定本取自于学院体系外壳借用倒是无妨,但如果连内核和运营模式也一同照搬到商业场很大的概率就是水土不服止于襁褓。

在外壳之下研究的机制、团队的建设、不同对话体系的打通、技术与业务的平衡,前瞻性与KPI的融合…才是商业公司研发体系的灵魂一切尚需从长计议。

从2014年设立阿里最神秘部门iDST到如今人才济济的达摩院阿里人工智能走過了既艰难又幸运的五年,梳理出这套技术体系的机制和脉络得以看清阿里人工智能的底色推而广之,或将成为互联网公司打造人工智能技术体系的方法

(文章转载自公众号“机器之能”,作者四月)

相关热词搜索:gmm,gmp认证,南阳二手房,南阳五中,

}

我要回帖

更多关于 AI怎么编组 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信