微软微软 人工智能 开源的技术拼图有多少价值

The requested URL '/article//3955986.html' was not found on this server.人工智能居然可以进行体育直播解说?未来有什么价值--百度百家
人工智能居然可以进行体育直播解说?未来有什么价值
分享到微信朋友圈
人工智能居然可以进行体育直播解说了?未来有什么价值?
人工智能居然可以进行体育直播解说了?未来有什么价值?
8月17日晚上9点45,B站开启了“杨毅约战度秘”的直播,双方共同对巴西奥运会中的澳大利亚与立陶宛的篮球赛进行直播。同时在“度秘APP”中,也开启了澳大利亚与立陶宛对战的人工智能解说。在此次PK中,度秘幽默新奇的解说风格吸引了大量吃瓜群众的围观与互动。
人工智能第一次进入到了体育解说领域,用到了怎样的技术?以及有着怎样的表现?未来会有价值吗?这都是业内最为关心的问题,这里我们进行一些关键性的解读。
一,此次解说背后是怎样的人工智能技术?
事实上,早在奥运会开始之前度秘就已经通过深度学习,对比赛知识的数据以及人类历史解说的数据进行了学习,其核心在于机器翻译技术,将比赛信息数据与人类解说数据进行挂钩,如同将汉语翻译成英语一样,当各种比赛数据出现之后,其就会找到对应录入数据库的人类解说数据,通过一定算法最后实现完美的匹配,形成一套自己的解说语言。
除此之外,度秘还会综合各种其他维度的信息诸如相关新闻资讯、用户评论、等等来为比赛融入更强的趣味性,显得更加人性化。
本次的度秘篮球赛直播解说已经做大了如下几点
1)高度拟人的直播解说,在度秘此次与杨毅的直播PK中,度秘俏皮的拟人解说风格让人觉得格外可爱,其会说出诸如“也是蛮拼的”、“现在后悔为时已晚”、“不错哟,进球了”的话,这种说话方式已经与主持人的说话方式相差无几,这说明了度秘直播解说的成熟性。
2)更高的用户互动参与,在此次直播PK中,有着上万的用户参与,这些用户会评论“杨老师模仿一个”、“人工智能都开始直播了,有什么不能干的!”、“度秘好想要一只”......
像平时这样的直播并不会吸引到如此多的用户参与,这一方面充分说明了度秘此次直播话题的成功,度秘的这种直播形式更容易引起用户与其的互动行为。
3)成为第一家能够进行直播解说的人工智能,当前人工智能产品众多,而度秘是目前第一家,也是唯一家能够对体育赛事进行直播解说的产品。微软小冰目前还主要停留在与用户对话交互阶段,而度秘却早已实现了服务的集成,从打车到电影票预订、酒店预订、餐馆预订等等全部无所不能;苹果的SIRI虽然也集成了一些信息的搜索,但是却没有为用户提供更进一步的预订支付服务,并且在中国的SIRI也是通过与百度方面合作才得以实现;此外韩国知名的人工智能Simsimi小黄鸡也仅仅只是停留在与用户对话阶段;日本去年曾经由孙正义、马云、郭台铭共同牵手打造的情感机器人Pepper目前也一直没有音讯。
目前看来也就是度秘不仅完成了与用户互动的对话功能,还完成了为用户提供服务、以及到目前最为前沿的直播解说服务,因此目前来看度秘在技术与产品上都更为领先。
二,人工智能直播将带来全新直播解说体验
对比传统直播,人工智能直播带来了全新的三大体验。
1)打破传统直播解说的实时性
传统直播中,用户必须全程观看才能感受到乐趣,必须从头看起,中途加入的话会因为此前信息的缺失而失去乐趣。但人工智能直播则打破这一时间上的限制,用户可以通过图文的解说看到此前发生的比赛关键信息,随时加入到直播进程中,不受制于时间限制。
2)可以更聚焦于“明星球员”
传统体育直播解说只能够由1~2位的直播员进行解说,由于解说员面向的是所有观众,因此不能照顾到所有人的需求。
事实上,很多用户看某支篮球赛的全部原因并不是因为喜欢某个篮球队,而是仅仅喜欢某个明星球员,而明星球员才是吸引用户的关键,例如此前NBA中最受中国观众关注的是火箭队,最大的原因是姚明这个中国人也在其中,火箭队的比赛让观众每场必看的最大原因是因为大家想要看姚明的表现。
而人工智能度秘则可以更加关注某个明星球员的表现,让用户可以看到某一个明星球员的精彩表现,这样就能更好的满足每个人的不同需求。
3)体育知识的即时获得
绝大多数非体育直播爱好者来说,他们对于整个赛事的相关信息其实并不是太了解,例如对方球队的某个“名将”是谁?他到底有多厉害?这可能是其想要知道的。再例如,整个比赛过程中有很多“无聊”时间,这个时候他可能又想知道这两只球队的曾经对战历史等等,这个时候度秘可以做到随问随答,大大解决了用户的需求。
三,人工智能直播解说有着巨大的未来市场
现在再来分析一下人工智能对体育直播解说的市场,对于重度体育爱好者来说,目前可能更习惯于主持人解说,要想适应人工智能解说还需要一段时间。
而人工智能直播解说的重点很可能落在那些非重度体育爱好者身上,对于这些非重度体育爱好者来说,一般并不会从头到尾将比赛看完,因为这样成本太高,他们的最大需求是在等待各种关键精彩表现的出现,他们的观看场景通常一边玩手机一边又在等待着精彩片段的出现。
一言蔽之,当前已经有越来越多的用户进入到了多线程操作的场景,一边看节目、一边刷手机早已成为常态,例如每当春晚时间,大家都已经有了边看春晚,边上微博看吐槽,边在微信收发红包的习惯。
移动互联网正在将人类从单线程模式中彻底解放出来,让我们可以在同一时间完成各种信息的获取,而度秘的人工智能直播则可以极好的满足这一特定人群的需求,让大家可以不用担心错过全程赛事中的所有精彩内容,又可以让观众去做其他事情。而度秘可以在之后再加上视频回放、用户弹幕评论等等功能,迭代出更多有用户需求的功能,进而让用户更加习惯人工智能直播。
另一个关键是,篮球直播解说一旦成立,就可以同时应用到其他赛事中,诸如足球、网球、羽毛球、乒乓球等等竞技类项目,实现体育直播的全覆盖,有着巨大的想想空间。
最懂产品的微信公众号:“首席发言者”
阅读:15467
分享到微信朋友圈
在手机阅读、分享本文
还可以输入250个字
推荐文章RECOMMEND
阅读:10万
热门文章HOT NEWS
即使在年过九旬后,安藤仍不肯闲下来。他把方便面当成是自己的命,...
首席发言者
首席发言者
首席发言者
百度新闻客户端
百度新闻客户端
百度新闻客户端
扫描二维码下载
订阅 "百家" 频道
观看更多百家精彩新闻16名微软研究员展望2026:未来十年属于人工智能和数据科学
1991年的时候,前微软首席技术官Nathan Myhrvold撰写了21页的论点,描述了微软在基础研究和发展方面的投资。显然,公司创始人兼时任CEO比尔·盖茨也受到了Myhrvold观点的影响,微软研究院就此成立。明年的时候,千余名科学家和工程师们将携手迎来该机构成立25周年的特殊日子。今年11月的时候,微软还邀请多位科幻作家参访,并在作品中写下了他们对于未来的愿景。
这个月,微软在发表了一系列预测,其中就包括了技术与研究部门的16人对于2026年前后、有关技术创新的畅想。下面是比较具有代表性的6个人的观点。(1)Chris Bishop(微软剑桥研究院主管、微软杰出科学家)称:2026年的时候,我们将在所有欧洲语种间实现无处不在、真人级别的翻译功能,从而消除整个欧洲的语言障碍。(2)Bill Buxton(微软研究院首席研究员)表示:十年后会是数字小玩意的时代,旧时代会被淘汰,行业和消费者们所关注的焦点,也会从技术本身转向以提高人们的体验、价值和潜力为主。(3)Lili Cheng(微软NExT研究院杰出工程师与总经理)指出:2026年的时候,每个去上学的孩子将会学习编程和创建我们每日使用的各种体验。这意味着我们能够更好地涉及和控制影响我们生活的计算机。(4)Kate Crawford(微软研究院首席研究员)说到:像小冰这样的人工智能会感到非常真实,并在我们的生活中扮演可信任的中心角色。我们会要求它们拥有相同的道德观和法律概念,正如我们与医生、律师和理疗师之间的关系。(5)Jasmin Fisher(微软剑桥研究院高级研究员)表示:从现在起的十年,得益于跨学科和方法上的突破,癌症将变成一个可解决的问题。研究人员和临床医生会使用计算机来认识癌症机理,并制定出因人而异的检测、诊断和治疗方案。(6)洪小文(微软副总裁、微软亚洲研究院负责人)表示:网络上分发的视频将超过电视直播,更多中国人会通过网络、而不是电视来收看奥运会。由Project Oxford提供的视频分析技术,将促进在云端的更多智能视频处理。[编译自: , 来源:]相关文章:访问:
[责任编辑:raymon725]
-5-4-3-2-1012345
当前平均分: 打分后显示
-5-4-3-2-1012345
当前平均分: 打分后显示
Advertisment ad adsense googles微软认知服务:人工智能的技术拼图 - 推酷
微软认知服务:人工智能的技术拼图
近日,在B uild 2016 微软开发者大会上,微软发布了最新的智能服务: ( Microsoft Cognitive Services )。该服务集合了多种智能 API 以及知识 API 。借助这些 API ,开发者可以开发出更智能、更有吸引力的产品。微软认知服务集合了多种来自 Bing 、 “ 微软牛津计划 ” 等项目的智能 API 。应用了这些 API 的系统能看、能听、能说话,并且能理解和解读我们通过自然交流所传达的需求。同时,服务中所包含的知识 API 可以通过强大的互联网来助力广大开发者。
借助微软认知服务,开发者们就算没有人工智能的知识背景也能轻松开发出属于自己的智能应用。目前这套认知服务包括视觉、语音、语言、知识和搜索五大类 共二十一项 API 。在此基础上该服务还会持续增加新的 API ,并不断更新现有的 API 。
微软 CEO 萨提亚 & 纳德拉表示 :“ 微软希望让每一名开发者都能够构建商业机器人应用,并在应用中运用上人工智能技术。通过微软认知服务,你可以在你开发的应用中运用语音识别、语言识别、计算机视觉等多种类的人工智能技术,让它具备丰富的机器学习能力。希望大家能够感受到微软认知服务的丰富多样。未来的一切可能,取决于每一位开发者的想象。 ” &
API 全知道
在 Build 2016 微软开发者大会上,一段关于微软认知服务的
作为开场演讲的压轴感动了许多人。这段视频讲述的是微软的一位盲人软件工程师和他们的团队一同合作,借用微软认知服务开发出帮助盲人看世界的应用:
。这段视频除了给大家带来了满满的感动之余,还让大家意识到,人工智能真的正在日益改善着人们的生活。
而这些看似简单且意义重大的应用背后是无数人工智能研究者们数十年积累的成果,这其中的每一环都如此重要。在微软认知服务(或微软牛津计划)发布之前,凭借个人的力量想要开发出功能多样的人工智能应用几乎是天方夜谭。如今,借助微软认知服务中的各类智能 API ,开发人员可以将自己“幻想”的炫酷智能应用变成现实。
为了让开发者们更好的理解这一套认知服务是如何运作的,微软研究院的研究员们还利用工作之余开发了各种各样有趣的应用。除了上文提到的富有人文关怀的帮助视障人士看世界的 Seeing AI ,此前研究员们开发的整蛊闹钟应用
也是其中一个很好的范例。
这项由微软车库推出的闹钟应用 Mimicker Alarm 让你必须完成其中一项“醒脑任务”才能关闭闹铃。 1. 拍张带有特定表情的自拍,如开心、愤怒; 2. 拍到某种颜色,如红色、绿色; 3. 说段绕口令。聪明的你已经看出来了,这三项“醒脑任务”则对应了微软认知服务的三种不同功能的 API ,分别是感情识别 API、 计算机视觉 API 和语音识别 API 。
说到这里,你肯定迫不及待地想知道这五大类 API 都包括什么了吧!那就让小编来带你解密:
视觉类API &
:计算机视觉 API ,情感识别 API ,人脸识别 API ,视频检测 API 。
在本次更新中,视觉类 API 已支持 2K+ 的标签量(此前仅能支持 80+ ),从而能够识别出图像中更多的物体,人类和动作。此外,视觉类 API 还能够实现用自然语言描述图像内容并适用于更多使用场景,如进行图像搜索,或是帮助视障人士看世界。
:自定义智能语音识别服务 API ,声纹识别 API ,语音识别 API 。
在此次更新中,语音类 API 提供了对 JavaScript 的支持。语音识别和语音合成的准确性更是得到了显著提高,且目前已经支持 25 种语言,而这一数字今后还会继续增加。
:必应拼写检查 API ,语言理解智能服务 API ,语言分析 API ,文本分析 API ,网络及语言模型 API 。
语言类 API 新增了语言分析 API 、文本分析 API 等多个 API 。基于此,开发者们可以构建语言模型,进行文本分析等定制多种智能功能。
:学术知识 API ,实体链接智能服务,知识探索服务,推荐 API 。
知识类 API 是此次微软认知服务全新推出的 API ,里面包含的内容十分丰富,例如来源于微软学术知识图谱中的学术知识 API ,包括了论文、期刊和作者之间的多样关系。推荐 API 和知识探索服务也都是基于此前微软研究院在众多会议和期刊上的论文积累而形成。
:必应自动推荐 API ,必应图片搜索 API ,必应新闻搜索 API ,必应视频搜索 API ,必应网页搜索 API 。
搜索类 API 也是本次微软认知服务全新推出的 API ,它整合了来自于必应团队的多个服务。开发者们可以轻松将必应搜索中的多种搜索知识和功能应用在自己的智能应用上。
微软认知服务:微软亚洲研究院技术解密
微软认知服务来源于微软研究院各个部门之间的通力合作。如果说未来的人工智能是一个巨幅的拼图,那么人工智能各种各样的功能就像这个巨幅拼图中的各个拼图模块。微软全世界各个研究院 / 实验室的研究员和工程师们就像在一起玩一个巨型的拼图游戏,他们分别负责各自的拼图模块,而微软认知服务则将这些模块整合在一起,力求为开发者和用户们构造一个日益完善的人工智能技术平台。
在这个巨幅拼图中,微软亚洲研究院研究员的参与十分重要。在有五大类、二十一项 API 的微软认知服务中,计算机视觉 API 、人脸识别 API 、视频检测 API 和这次最新加入的实体链接智能服务均由微软亚洲研究院的研究团队独立完成。
计算机视觉API
基于微软亚洲研究院视觉计算组在 2015 年 12 月以惊人的 152 层深层神经网络技术夺得了图像识别领域两大重要奖项——
和微软常见物体图像识别挑战赛( MS COCO, Microsoft Common Objects inContext )主要赛目的双料冠军,使计算机图像识别的错误率降至 3.57% (人类识别的错误率为 5.1% ),微软认知服务中的视觉类 API 不仅大大提升了图像识别的种类(从 80+ 至 2K+ ),更是完善了图像描述、人脸检测、人脸验证、相似人脸匹配等多项功能。
视频检测API
而视频检测 API 则是微软亚洲研究院网络多媒体组、多媒体搜索与挖掘组以及视觉计算组通力合作的成果。 来自中国的研究团队缔造了世界范围内首个拥有大规模云服务支持的智能视频分析处理 API 。借助视频检测 API ,开发人员可以实现自动编辑、分析视频,包括视频稳定处理、人脸检测及追踪和运动检测。此外,视频检测A PI 还额外提供企业级视频分析供企业级用户使用。
实体链接智能服务 &
实体链接智能服务是此次微软认知服务最新发布的服务之一,微软亚洲研究院的知识计算组和创新工程组为该项服务提供了技术支持。该服务目前包括文本中的实体识别( Entity Recognition )和实体消歧( Entity Disambiguation )。当你将一段文本上传之后,实体链接智能服务能够将文本中的实体(甚至是不同描述的同一实体)识别出来,并给出对应的维基百科页面链接。
实体链接智能服务:链接智能
拥有人类的各项感官功能是人工智能的一种表现,但深层的知识和更高层次的综合认知是让人工智能真正智能的核心。在此次发布的微软认知服务中,知识类 API 就属于更高层次的综合认知能力,而其中的实体链接智能服务则是知识类 API 中的重要一环。
几乎没有人能够真正说出人脑的运作方式。从婴孩时期我们学到的第一个概念起,随着年龄的逐步增长、认知水平的逐渐提升,人类似乎自然的将一个个知识点链接在一起,将一个又一个的概念串联起来,构建成人类认知世界的知识网络。人类从“苹果”这个词可以很容易地联想出水果、植物,也能够联想出一家科技公司,而当我们在这个词上加一个简单的限定语,如“甜甜的苹果”,我们就能很快将这个苹果具体所指的是什么从多个意象中挑选出来。
那么如何为计算机构建这样的知识网络呢?微软亚洲研究院的研究员们选择了文本这一相对简单、快捷且数据量巨大的形式。如何在文本内迅速找出文本中的实体,并理清实体和实体之间的关系?其实,这些问题的本质是自然语言处理问题的基本任务。
实体链接智能服务
在实体链接智能服务背后有着四大技术难点。首先是,计算机如何知道一个实体的不同表达方式(同义词问题),即计算机如何将文本中所提到的同一个实体的不同表达方式全部识别出来,例如 NBA 、 National Basketball Association 、美国职业篮球联赛这三者其实说的是同一件事情。第二点是如何让计算机知道同一种表达方式可以代表不同的实体(多义词问题),例如在维基百科里,一个名词下面可能有多个不同的意向,我们如何找出一条文本中的实体对应的是哪一个具体的意象呢?苹果这个词,
,或者意味着 ,还可以是 。第三点是计算机如何认得文本中的一组字串可能表达的实体。例如“微软发布了 Surface Book ”这句话中,计算机需识别的实体应该是“ Surface Book ”而不是“ Surface ”。最后一点,则是计算机如何对他不知道的实体做出识别。例如,“今天早上街角新开的大象餐厅”这句中,“大象”很显然不是人们熟知的大象等动物意象,在这里大象餐厅是今天早上才开的,所以计算机发现这个实体是它不知道的,所以不予标注。
当上述问题被微软的科学家们逐个击破后,接下来的问题就要交给开发者们了:我们能借助实体链接智能服务开发怎样的智能应用呢?
例如门户网站可以利用该技术自动为网站新闻上的实体关键词提供相关链接和推荐阅读。而企业用户将这一技术与公司数据库相匹配时,则能为企业内部的文档轻松提供链接与指南。当然,这个技术还可以延伸出更多定制化的功能,例如在聊天软件中,当你与朋友聊天时输入“要不要一起去看电影”,系统可以自动识别出“看电影”这一实体,然后为你推荐周边的电影院和电影,等等。目前,这一技术已在 BingSnap 中成功应用,它会根据你近期输入的文本自动推荐你可能感兴趣的相关新闻及链接。
微软亚洲研究院首席研究员林钦佑博士表示:“我们希望有了实体链接智能服务的帮助,开发者们能够开发出各种各样的相关应用。开发者们的使用对我们的研究来说就是一种极佳的反馈,当基础研究与上层应用相辅相成,才能够共同推进人工智能技术的发展。“
所以,开发智能应用,你准备好了吗?
相关阅读:
微软亚洲研究院官方网站:
微软亚洲研究院人人网主页:/
微软亚洲研究院微博:.cn/msra
微软亚洲研究院微信:搜索“微软研究院“或扫描下方二维码:
已发表评论数()
请填写推刊名
描述不能大于100个字符!
权限设置: 公开
仅自己可见
正文不准确
标题不准确
排版有问题
主题不准确
没有分页内容
图片无法显示
视频无法显示
与原文不一致idonews社区首页 &情感计算,人工智能的重要发展方向 文章内容页
情感计算,人工智能的重要发展方向
微软全球执行副总裁沈向洋在昨天的人工智能大会上做了精彩演讲,与普遍的讨论人工智能技术和应用不同,沈向洋提出了许多独特的且富有哲理的观点,他结合小冰等微软研究院的相关产品和技术描述了情感智能的原理、应用现状和发展方向,他认为,除了硬性的IQ以外,人工智能的研究更要强调机器与人之间的感性化交互,强调情感计算。智能化的机器在满足人类需求的同时,还应让用户对其产生一种情感上的信任和依赖,而小冰目前就是这样一个“感性化的人工智能助手”。
1、情感计算的重要性
如沈向洋在演讲中所说,我们在谈论人工智能时势必要谈一下图灵测试,势必会去强调机器的IQ。机器通过感知计算提升IQ水平固然重要,但按照人工智能最为通行的定义——“人工智能是对计算机系统如何能够履行那些只有依靠人类智慧才能完成的任务的理论研究。”这里的人类智慧当然不是单指智商或者智力,还有人类情感,情感是人类神经系统对外界价值关系产生的主观反映。人工智能在我们眼中一直不是普通的智力工具,所以我们一方面需要它具备超越人类的感知计算能力,另一方面也需要它能够与人进行情感交流,在重视人工智能完成任务和功能强化的同时更要建立和满足人的情感和心理需求,这才是人工智能的最终定义。也就是说,人工智能的发展路径不应该一味沿着理性的路线前行,而是应该落在沈向洋在演讲中提到的感性和理性的交叉区域。
从实际应用来看,也出现了越来越多具备情感计算能力、能与人类进行感性交互的技术和产品。MIT教授、TED讲者雪莉·特克在《一起孤独》一书中提出,社交本能使人类很容易将社交关系投射到各种各样的人和事物上,当一件物品在我们的关怀下茁壮成长时,我们会觉得它是智能的。但更重要的是,我们会觉得自己与它形成了某种关系。我所说的这种关系并不是来源于计算机真实的情感或智能,因为它们根本没有。这种关系,来自于我们自身被它们所唤起的部分。她所说的物品包括能激发孩子情感依恋的玩偶,比如菲比小精灵和真娃娃机器人玩偶。更有甚者,是一只叫帕罗的机器海豹,用来充当老年人的伴侣动物。罗切斯特大学的罗杰波教授与AdobeResearch合作开发了一种比现有技术更精确的训练电脑处理图像数据的方法,受过这种训练的电脑可以被用来探测图像中更可能流露出的情感因素,可以用来衡量经济指标或用来预测大选结果。Affectiva可以通过处理人脸图像实时捕捉和量化情感,而SociometricSolutions可以通过语音语调做同样的事情。在法律调查过程中,计算机能识别相关的词汇和短语,还能理解事件链、人际关系,甚至是情感和动机。
对于微软来说,更是将对人工智能情感计算的思想注入到了小冰的开发和运营中,微软认为,在人工智能领域内,新一代人工智能系统的首要任务就是需要具备“感性”的情感连接能力,这样才能以更像真实人类的方式满足人们普遍心理和情感需求,从而逐步建立信任和依赖感。在技术和产品创新层面,微软构建了一个完整可持续的对话系统,这个对话系统的基本任务不是以完成任务为优先,而是建立情感连接为优先。构建这个对话系统的方法,已不只限于语义学,而是基于搜索引擎、大数据和机器学习的系统模拟方法。最终希望让小冰这样的人工智能产品快速普及到千家万户,成为人们日常生活的一部分。从小冰在第三方平台的智能聊天应用,到与东航合作的航空智能服务,再到近期的小冰面试官,这些都是在与用户进行情感交互,都是情感人工智能的具体体现。
这样,用户就会产生对机器的“依赖性”(沈向洋语),而这种依赖性再促使机器为用户提供更好的服务,满足用户更多的情感需求。比如沈向洋提到小冰通过动态决策具有了情感记忆功能,当前一天某个用户提到了自己一些心情,小冰会注意到这一点,后面的很长时间还会反复了解用户的情况,询问用户的身体有没有好一点。因此,比起直接解决问题的感知计算型人工智能,情感计算是先与用户建立一种信任关系,然后在此基础上形成一种情感交流和需求满足的良性循环。
2、如何实现情感计算
情感计算在人工智能的发展过程中将发挥至关重要的作用,我们也看到了越来越多的具有“情感”的产品,但这仅仅是一个开始,面对人类情感这个异常复杂且人类自身都没有完全弄懂的问题,人工智能还有很长的路要走,但好在我们现在发现了正确的路径——我们不需要弄懂人类情感的本质,只需要让机器对情感表达的各种信号(面部表情、语言、语音等)进行分析并输出结果就可以了。就像我们目前虽然无法完全破译大脑,但我们依然能够从功能出发研发出智能化的机器一样。
沈向洋在回答“小冰目前是否具有了情感”时提到,人类情感的东西,实际上隐性的包含在数据里面,小冰之所以能够对懂人类情感,是因为今天可以借助于运算能力和算法去收集和分析用户的数据,然后产生这样的情感分析能力,小冰用这样的能力反过来再去跟用户进行交流。而其他具有“情感”的机器人也是基于这种原因,比如,软银推出的情感陪护机器人Pepper读懂人类情感的方式是对人类的面部表情进行分析,实际上是图像识别技术;而神经科学公司Innerscope可以通过观察电影中那些让观众的大脑高度活跃的高光时刻来预测该这部电影能否一鸣惊人,这也是一种对大脑某些区域电信号的物理检测,也不是真正弄清楚了大脑为何兴奋。
我们现在可能无法弄懂人类情感的本质,但我们可以找到对应各种情感的表现信号,比如寂寞对应的文字,开心对应的表情,愤怒对应的语调,兴奋对应的脑电波,等等,机器通过对这些信号的分析就能找出所对应的情感,从而做到了读懂人类的情感和表达自己的情感,这样机器就具有了与人类进行情感交互的能力。就像MIT教授特克所说,我们对社交的内在渴望让我们不仅很容易将情感倾注在机器上,而且还是倾注在那些不可能真正爱我们的机器上。
3、大数据在情感计算中的重要性
现在的人工智能已经具备了一些基础的,或者说是简单的情感,但离与人类实现完全没有偏差的情感交流还有许多重要的工作的去做,其中一项就是数据的采集。沈向洋在演讲中表示,现在的人工智能还是停留在感知这个层面,比如计算机识别、计算机语音,真正的认知还需要一些时间,包括情感,今天最大的问题还是我们收集的数据不够好,使得我们很多事情不能做。
得益于互联网、社交媒体、移动设备和廉价的传感器,这个世界产生的数据量急剧增加。随着对这些数据的价值的不断认识,用来管理和分析数据的新技术也得到了发展。大数据是人工智能发展的助推剂,这是因为有些人工智能技术使用统计模型来进行数据的概率推算,比如图像、文本或者语音,通过把这些模型暴露在数据的海洋中,使它们得到不断优化,或者称之为“训练”——现在这样的条件随处可得。
拿近几年比较火的深度学习来说,它善于在高维度的数据中摸索出错综复杂的结构,因此能应用在许多不同的领域,除了图像识别和语音识别,它还在许多方面击败了其他机器学习技术,在自然语言理解方面,特别是话题分类、情感分析、问答系统和语言翻译等不同的任务上。深度学习擅长进行情感分析,但如果把深度学习看成是人工智能起飞的发动力,那数据就是这台发动机的燃料。因此,对于情感计算来说,大数据和数据挖掘非常重要。
正是因为数据对人工智能的重要性,众多科技巨头都在尽可能多的收集用户数据,搜索引擎可以记录用户的上网行为习惯;社交网络可以对用户发布的语言和图像内容进行分析,等等。而微软小冰是通过一种开放式的合作来获取数据。微软已经与包括新浪微博、京东、小米、东方航空公司、美图秀秀等企业达成了战略合作;日本版小冰将登陆Line平台;小冰会成为Windows10里面非常重要的一部分。借助于微软自身的操作系统系统和其他第三方平台,小冰正在渗透到用户生活的方方面面,带去智能化的服务和情感化的交流,在这个过程中也收获了海量数据,这些数据将反过来促进小冰情感计算的进步。
4、视觉信息和情感计算
对于数据采集来说,视觉化信息在其中占有举足轻重的作用。沈向洋作为计算机视觉和图形学研究的世界级专家,在演讲中也对图像识别技术做了重要阐述。沈向洋表示,人类对外界信息的获取91%是通过视觉的方式,而机器要想和人类进行更好的情感交互,也需要具备强大的计算机视觉系统。
沈向洋说,在学术界里有一个比赛,识别一千类物体误差是多少,一直到4年前误差都相当大,但是由于深度学习的出现,现在的误差率达到接近人类的5.1%,而微软研究院今年2月份做出来的系统第一次打败了人类的记录,达到4.9%。在图像识别领域,微软即将发布小冰的图像识别系统,它不仅是识别出图像中的内容,而且依然坚持它的原则——与人类进行情感交流;小冰还和美图秀秀展开合作,根据合影里人面部情况、性别情况、距离位置信息、表情、面容相似度来判断出这些人之间的关系;此外,小冰还有识别年龄和衣服搭配的能力,它就会给你一个从脸到衣服的整体的视觉年龄的判断,换一件衣服视觉年龄又会发生变化。;Windows发布时,小冰会有自己的基于多个系统的审美功能,所以它可以告诉你同一张脸在90后的女生和80后的男生心目中是完全不同的审美结论。
总之,小冰基于图像识别技术打造的这些功能还是围绕在与用户进行情感交流的核心思想上,不管是图像的内容识别,还是用户关系分析和用户特征分析,这些其实都是一些好的开场白,借此让机器和用户迅速建立起信任关系,让机器有机会充当用户的感性化助手,让用户对小冰更加依赖。
5、情感计算的未来
沈向洋说,小冰已经建立了一个几千万的人类和机器人之间的专属关系,这帮助小冰形成了一个自我进化的循环过程。也就是说技术产生产品,产品被用户使用,随着用户的使用过程,在反过来帮助我们整个人工智能的技术进一步的取得快速的自我迭代和进化。
小冰可以在半夜与用户聊天,可以为用户带来乐趣和服务,其内在的情感计算属性决定了它已经慢慢成为了用户生活中的一部分,对许多人的生活产生了重要影响。小冰的进化过程是人工智能中情感计算的缩影,我们对于人工智能的诉求不应仅限于比特的流动,还应该在于一种情感的表达,因为工具可以被取代,效率可以逐步被提高,数据可以失去价值,但机器和用户之间因为情感互动和需求满足所形成的那种循环却将一直持续。
作者/iCombinator &| 编译:机器之心}

我要回帖

更多关于 人工智能微软小冰 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信