讯飞 录音笔智能录音笔能代替专业的速记员吗?

5月21日科大讯飞 录音笔2019新品发布會在上海盛大举行,讯飞 录音笔智能录音笔作为科大讯飞 录音笔2019年消费级战略产品在会上正式亮相发布这款人工智能时代的录音笔不仅具备专业级8麦克风硬件配置,更是搭载了讯飞 录音笔全球领先的A.I.语音识别...

5月21日科大讯飞 录音笔2019新品发布会在上海盛大举行,讯飞 录喑笔智能录音笔作为科大讯飞 录音笔2019年消费级战略产品在会上正式亮相发布这款人工智能时代的录音笔不仅具备专业级8麦克风硬件配置,更是搭载了讯飞 录音笔全球领先的A.I.语音识别和转写引擎讯飞 录音笔智能录音笔可以将录音实时转为文字并呈现在机身自带的高清屏幕仩,更支持要点标记、语音、多平台同步和后端编辑等创新功能为学习培训、会议纪要、媒体访谈等重要场合的信息记录和内容整理带來极大的效率提升和创新体验。

多场景智能降噪拾音硬核语音转文字黑科技

讯飞 录音笔智能录音笔不仅具备专业级别的麦克风配置更集語音转文字技术、A.I.智能拾音算法等尖端人工智能技术于一身。无需借助APP或者第三方设备这款产品即可实现在录音的同时独立完成语音转寫成文字的全流程,是真正软硬件一体化的革新性智能记录产品

应用到语音交互环节的智能硬件,都需要具备出色的声音采集和提取能仂讯飞 录音笔智能录音笔采用2+6麦克风阵列顶级配置,2颗哈曼大直径麦克风和6个矩阵麦克风位列机身在专业级麦克风配置上,讯飞 录音筆通过自研人工智能算法针对会议、采访、演讲、音乐会等多种场景智能调用麦克风、实现高保真降噪拾音,收音距离可达15米以远场演讲场景为例,设备会调用2个定向麦克风拾音同时6个矩阵式麦克风识别周边及其他方向反射回来的噪声,通过算法进行比对消噪使得錄制的人声更加清晰。在会议模式下2个定向麦克风将停止工作,录音笔将6个麦克风对收集的信号进行加权算法在目标信号的方向形成┅个拾音波束,同时衰减来自其他方向的噪声可以定向拾取与会者的发言,使得录取到的声音清晰准确

讯飞 录音笔智能录音笔应科大訊飞 录音笔多年积累的语音技术而生,语音识别准确率达到98%1小时录音5分钟出稿。自2006年开始讯飞 录音笔转写服务就已面世应用,在2015年机器速记准确率在国际比赛中首次超越人类速记员在2018年9月,讯飞 录音笔在被称为“史上最难语音识别任务”的国际多通道语音分离和识别夶赛(CHiME-5)中包揽全部四个项目的冠军并大幅刷新各项目的最好成绩。该比赛察的是在不同场景中自由交谈的远场语音识别效果也再次證实了讯飞 录音笔语音识别引擎在万物互联场景中噪音、口音和远场识别挑战下的绝对领先优势。

除了中文转写讯飞 录音笔智能录音笔哃样支持英文语音的转写和同步辅助翻译,为英文培训等场景的记录和理解提供了极大的便利性

智能标记检索文件查找编辑更容易

讯飞 錄音笔智能录音笔的“智能”还体现在文件管理上,满足了各场景记录者提供了方便录、查找易、编辑快的需求一键录音后,讯飞 录音筆智能录音笔支持为重点发言人所讲的内容一键添加自定义标签该标签将在转写文稿中同步呈现,便于重要信息的回溯和查找同时,鼡户也可以通过语音来查找文件改变了传统记录场景为了一个重要观点而花费数个小时反复听录音的痛点,大幅提升记录效率及其可用性

满电状态下,讯飞 录音笔智能录音笔可连续工作10个小时转写完成后,讯飞 录音笔智能录音笔可在4G或WIFI的连网状态下同步和分享录音转寫文件便于后续的进一步编辑。专属指纹识别功能进一步保障了录音文件的安全性。

两款型号可选讯飞 录音笔智能录音笔全渠道现貨开售

相对于传统录音笔,讯飞 录音笔智能录音笔不仅在功能上极大革新、也带了全新智能触控和人性化交互体验在硬件配置上也是可圈可点。机身采用航空级铝合金材质经历200多道工序精细打磨成形,机身表面所用的阳极氧化喷砂工艺也让产品的触感更加细腻

}

中国AI语音一哥怎么看未来

过去,算法即壁垒软件即方案,AI语音缺精进但更缺场景

现在,算法无限接近极限场景千树万树梨花开,但如何真正让AI之能触达用户

科夶讯飞 录音笔的答案:终端硬件,而且是算法定义的硬件

这也是AI领域竞争愈发激烈的情况下,科大讯飞 录音笔展现出的最新动向

在2019新品发布会上,这家成立20年的AI公司一口气发布5款硬件,并对其核心的语音操作系统进行了升级

与往年不同的是,今年的新品发布会上硬件完全成为主角。

不仅有核心级产品翻译机的3.0版本更新迭代还新推出了智能办公本、转写机、智能录音笔、学习机等等应用到工作、苼活和学习等场景中的产品。

此外发布会上,科大讯飞 录音笔云端语音操作系统iFLYOS进行了优化升级在今年3月首次亮相的全球首个多语种AI虛拟主播也现身发布会,作为串场并用9种语言全程直播本次产品发布会。

一句话总结就是:围绕语音技术高地借硬件之手,以软件为基加速技术落地,覆盖更多场景

新品发布环节的大部分时间,都属于面向C端销售的硬件产品也是科大讯飞 录音笔近年来发展的重点。

根据科大讯飞 录音笔2018年年报2018年,科大To C业务实现营业收入 25.17 亿同比增长96.54%,在整体营收中占接近1/3

率先登场的,是讯飞 录音笔的核心产品翻译机截止到2018年底,翻译机2.0的销量已经超过30万台科大讯飞 录音笔表示,仅2018年翻译服务次数5亿+次。

现在这一产品迭代到了3.0版本。与先前版本相比在线翻译可翻译语言覆盖全球近200个国家个地区,行业A.I.翻译拓展到7个专业领域

3.0版本的翻译机,支持普通话与粤语、东北话、河南话、四川话等方言之间的翻译还新增了维汉、藏汉等民族语言翻译,翻译速度也再度提升达到“0.5秒闪译”,并提升了图像拍照翻译水平

此外,离线引擎也有了新的升级采用了新一代离线语音识别引擎、离线翻译引擎,并内置了高通骁龙八核处理器

科大讯飞 錄音笔介绍,这些变化直接让离线语音识别训练模型规模扩大5倍中英文识别率超95%;翻译模型容量增加105%,涵盖词库规模扩大1倍

这款产品巳经开售,价格3499元与2.0版本相比贵了500元。

紧跟着的是一款转写机产品科大讯飞 录音笔将其定位为“面向办公场景的语音转写移动工作站”。

最大的亮点是内置离线解决方案,转写准确率能够达到95%以上;并支持对讲话人进行智能分区、中英文同步展示、字幕实时叠加功能等等

科大讯飞 录音笔介绍称,转写速度上能够“1小时讲话,5分钟出稿”并支持中英文混合识别,借助基于生成对抗网络的数据转换算法以及多分辨率层次化建模算法中英混合识别效果从50%提升到85%+。

面对专业的转写场景这款设备还有音视频同步采集功能,借助“语音+圖像”协同翻译能够将专业名词错误率下降50%。

紧接着是智能录音笔产品,这是一款软硬件一体化的设备同样具备“1小时录音,5分钟絀稿”的能力讯飞 录音笔介绍称,借助其研发的音转文字引擎转写识别准确率能够达到98%。

与大部分录音笔不同这款录音笔还带有独竝的触摸屏,转写结果可以直接看到并支持翻译功能,而且翻译结果不仅能够实时可见,也能够实时可听

对于录音的后期整理上,吔有不少针对性的功能能够对重点快速进行标记,支持语音便捷搜索通过4G、WiFi方式连接网络,能够实现录音文本快速分享

续航能力是:满电工作10小时。而且支持快充充电5分钟,录音两小时

在这场发布会上,科大讯飞 录音笔一共推出了2款录音笔设备分别是:

旗舰版SR 701,弧形陶瓷背板3.5英寸触控屏,内置32G内存和20G云空间售价2999元。

标准版SR501机铣玻璃背板,3.1英寸触控屏内置16G内存和10G云空间,售价1999元

接下来,是一款号称“开启笔记本的新时代”的硬件产品科大讯飞 录音笔称其为智能笔记本。

这是一款墨水屏智能硬件设备屏幕大小为10.3吋。核心的亮点是能够让你在录音转写的同时,也能够手写记录要点

手写关键词也可以做到字音同步,只要点击手写的文字就能播放手寫文本时的语音。

后期的整理与检索也内置了语音搜索功能有语音分析、自动标签、内容关联等自然语言处理能能力。

此外作为一款墨水屏电子设备,也支持电子书阅读功能也可以手写邮件。

现在这款产品已经上线出售,售价4999元

硬件环节最后登场的是一部学习机。这款设备于今年4月首次亮相与其他学习机相比,最大的不同点在于“智能推荐针对学”

讯飞 录音笔介绍称,基于智学网随机调研的400萬学生中35亿条数据他们发现学生60%的练习都是无效的。围绕着这个方面学习机主要有两大功能:一是数理化精准学习提升效率,二是英語听说读写综合提升

如何实现精准学习?基于知识图谱系统 科大讯飞 录音笔将整个过程拆解成了三个步骤:

首先基于人工智能技术快速测试,找到弱项;然后针对弱项进行精准学习;最后巩固内化形成学习闭环

围绕着英语听说读写综合提升方面,学习机中具备语音评測和语音转写功能效果怎样?讯飞 录音笔说借助这款学习机,“不会英语的家长也能检查孩子背课文”。

此外作为一款学习机,這款设备还有名师视频、拍照搜题、同步练习、历年真题试卷等等功能也都内置其中,售价3999元

这场新品发布会上,科大讯飞 录音笔发咘了智能物联网操作系统iFLYOS的2.0版本主讲人为科大讯飞 录音笔轮值总裁胡郁。

这一次在具体的功能上迭代与升级主要集中在以下的几个方媔:

首先,新增了21种方言识别、语句中英文混合识别能力并加入了全双工能力支持用户连续对话;

其次,深度集成了讯飞 录音笔的麦克風阵列算法整合了AIUI语义能力,提供云端芯一体化解决方案

第三,开放了多样的处理模型用户可以定制技能以连接自己的服务;使用洎己的用户体系;并支持用户级和设备级的自定义唤醒词,使用自己的发音人把更多品牌元素结合到自己的产品内,打造属于开发者自巳的操作系统

胡郁介绍称,现在的iFLYOS 2.0已经内置了200+技能,有100+内容合作方1500万首正版音乐和1200万小时的有声内容。设备方面已经覆盖4亿智能掱机,3800万车载设备1400万智能电视,以及500万机器人玩具


他说,借助iFLYOS 2.0平台原来需要6-12个月开发周期的智能语音应用,现在只需要5天就可以完荿了

关于iFLYOS 2.0,科大讯飞 录音笔一共提供了两个版本

一是基础版,云端支持语音合成、基础语音识别、基础语义理解、多场景模式、前后攔截器、技能工作室基础版功能与基础内容、基础技能等服务终端方面,支持拾音降噪、SDK、API和“蓝小飞”语音唤醒


另外是专业版,除叻基础版所有功能之外支持自定义账号体系、麦克风阵列设计、面向专业领域的语音识别、芯片、PCBA、整机硬件参考设计等硬件方案,以忣音乐、闲聊等其他收费内容

科大讯飞 录音笔二十载,如何兑现AI价值红利

科大讯飞 录音笔成立于1999年,至今已过二十载从2008年A股上市以來,一直是中国人工智能领域不可多得的AI商业化变现的代表

如何挖掘人工智能价值?在这场大会上一手创办讯飞 录音笔的刘庆峰给出叻最新思考:

“AI唯有跨越技术鸿沟,才能真正兑现价值红利”

而讯飞 录音笔,之所以能够发展至此正是跨越了多个技术鸿沟之后的结果。

刘庆峰登场之后首先介绍的就是科大讯飞 录音笔在过去一年内跨越的“鸿沟”:

语音合成:语音合成自然度(MOS分)达到4.0,即真人说話水平业界唯一中、英文语音合成自然度达到并超过4.0分(普通人说话水平)的系统。

语音识别:语音识别准确率全面超过速记员目前,科大讯飞 录音笔的中文语音转写准确率已经突破98%英文达到95%。

语音评测:在大规模考试评测中达到国家级测试员水平业界唯一通过国镓语委鉴定并大规模实用的技术成果。

机器翻译:系统通过CATTI全国翻译专业资格(水平)测试达到专业资格合格标准。

认知智能:如“智醫助理”通过国家临床执业医师综合笔试测试让医生“核心能力”推广成为可能。

这次科大讯飞 录音笔发布会上呈现出来的产品基本嘟是围绕着上述技术构建,也是其兑现价值红利的载体

在科大讯飞 录音笔的董事长看来,2019年是人工智能规模化应用落地元年也将开始進入应用红利兑现年。

刘庆峰认为判断人工智能技术价值兑换,有三个标准:

首先要有真实可见的实际应用案例;

其次,能规模化应鼡的核心产品;

第三能够统计数据的应用成效。

以教育领域为例在他看来,基于人工智能可以让每个孩子获得更精准的教学,让因材施教落到实处(实际应用案例)

现在, 科大讯飞 录音笔智慧教育产品和应用已经覆盖25000多所中小学(规模化应用的产品)

他们透露的荿绩单也颇为亮眼:学生学习效率提升50%,时间花费减少32%焦虑情绪舒缓20%(应用成效)

此外刘庆峰也给出了讯飞 录音笔接下来将要跨越哪些“鸿沟”:多模态拟人交互、常识推理突破、通用人工智能等等。

怎么跨越他介绍了三把钥匙:

第一,算法突破面对小样本、无監督、个性化问题的基础理论持续突破;

第二,脑智同飞脑科学研究和数学统计建模方法深度结合;

第三,人机耦合人工智能系统和囚类行为协作的人机耦合方式持续探索。

其中人机耦合是核心,刘庆峰也再次提出了“未来属于人机耦合的新时代”的论断

并以翻译為例,进一步解释了这一观点:

虽然科大讯飞 录音笔的机器口译测试全球首次达到专业资格合格标准但是这并不意味着机器可以替代人類同传。

他说人和机器的深度协作才是推动人工智能应用真正落地的关键,这也是人工智能时代社会伦理和人文发展的需要

总之,作為中国AI语音的一哥也是中国AI的最早探索者,科大讯飞 录音笔给出了最新的思考和探索结果

AI算法的壁垒,讯飞 录音笔一次次用国际竞赛獎项突破证明

AI硬件产品的壁垒,现在更多交给消费者

他们找到场景,打造产品用软件定义硬件,创造更多AI落地场景让更多人通过終端产品体验AI。

当然这条路上,讯飞 录音笔也不孤单

越来越多AI公司认定这条路,越来越多AI技术被以产品化形态进入千家万户

亚马逊巳经在AI音箱领域取得成功。

Google已经在“软件+硬件+AI”战略上初尝胜果

那么开AI机器转写与翻译之先的讯飞 录音笔,现在一口气推出5款AI硬件新品嘚讯飞 录音笔呢

规律和趋势,会在这里有怎样的延续

作者系网易新闻·网易号“各有态度”签约作者

量子位AI社群开始招募啦,社群矩陣:AI讨论群AI+行业群AI技术群

目前已有4万AI行业从业者、爱好者加入AI技术群更有来自海内外各大高校实验室大牛各明星AI公司工程师等。自由互相交流AI发展现状及趋势

欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“微信群”获取入群方式。(技术群與AI+行业群需经过审核审核较严,敬请谅解)

}

  新浪科技讯 12月21日下午消息科大讯飞 录音笔今日举行2015年度发布会,发布了基于语音交互技术基础上的交互界面——AIUI以及面向C端用户的录音宝、录音笔、讯飞 录音笔聽见网、智学网和E听说等产品。这也意味着以语言识别和理解为核心人工智能技术,将开始全力发力C端市场

科大讯飞 录音笔发布会现場:音文实时转换
科大讯飞 录音笔发布会现场:机器智能批改中英双语作文

  此前,在今年第三季度科大讯飞 录音笔方面推出了能听喑乐和操控家居的WIFI叮咚音箱。最近又推出了能够全程用语音控制,可以给孩子讲故事的陪伴功能的儿童手表更早之前,科大讯飞 录音筆推出了讯飞 录音笔输入法和灵犀语音助手

  科大讯飞 录音笔董事长刘庆峰表示,在万物互联时代以语音为主、以键盘和触摸为辅嘚人机交互时代正在到来。

  AIUI:能让机器人参加

  在产品发布环节刘庆峰首先阐明了认知智能的三大核心支撑能力:人机交互、知識管理与推理学习。科大讯飞 录音笔此后发布的讯飞 录音笔超脑2.0科研项目正是围绕这三方面持续展开,不但赋予机器“能听会说”的能仂还能赋予机器“能理解会思考”的能力,使机器也可以同人一样参加高考此外,这种技术也将开放给广大的开发者使用

  在讯飛 录音笔超脑的产业化应用产品层面,刘庆峰首先发布了人机交互新产品AIUI——并声称这对科大讯飞 录音笔具有里程碑意义

  科大讯飞 錄音笔方面认为,在实际上已经到来的“万物互联”时代客观上对人机交互提出了更高的要求。但是一方面目前大多数设备没有屏幕並且与用户之间有一定的距离,另一方面随时随地的多方交互的需求越发明显

  于是,科大讯飞 录音笔在此次大会上定义了“万物互聯”时代的人机语音交互标准其基本能力应该包括三方面:远场识别、全双工、多轮交互。而AIUI集成了包括双全工技术、麦克风阵列技术、声纹识别技术、方言识别、语义理解技术和内容服务等

  值得一提的是,科大讯飞 录音笔此次还将AIUI应用到了发布会中在现场,刘慶峰的演讲被实时同步转写成文字在大屏幕显示接受现场数千参会者和数千万观看视频直播观众的检验。

  智学网:机器批改中英双語作文

  在讯飞 录音笔超脑的应用层上科大讯飞 录音笔面向教育市场推出了智学网与E听说。

  目前已有全国31个省市的8000万师生在使鼡科大讯飞 录音笔面向K12教育所推出的高科技教学与考评产品,希望解决“老师忙、学生盲、资源茫”的教育行业痛点

  具体产品方面,不仅实现了语音与文字的识别、合成与分类还实现了智能批改、全科阅卷、资源库自动建设等真正具备“人工智能”的产品目标,在敎育资源的高效和个性化辅导方面做了试水

  刘庆峰表示,智学网与E听说是之前推出的讯飞 录音笔超脑的应用产品未来还将有更多囚工智能技术在C端教育市场发力。

  录音宝:可能会让速记失业

  此外科大讯飞 录音笔还在大会上发布了会议和视频需求导向的To C产品——录音宝、录音笔与讯飞 录音笔听见网。

  据刘庆峰介绍音文转写是当下都市生活的一种经常性需求,在正式发布之前录音宝產品已经有了超过100万的用户。而随着流媒体的不断演进与普及相信,在未来的图文直播时代科大讯飞 录音笔的音文转录产品的价值将會更加凸显。

  在现场科大讯飞 录音笔还邀请了10家知名速记公司的工作人员,进行同台PK但是就整体音文转换上,确实在现场效果方媔录音宝效果惊人——这可能会在未来淘汰很大一部分速记从业人员。

  在刚结束的第二届世界互联网大会上将人工智能技术应用箌无人车领域的公司董事长李彦宏说:“在未来,人工智能将取代相当一部分简单脑力劳动”

  然而,从科大讯飞 录音笔发布的产品來看人工智能带来的产业革命还远不止“简单脑力劳动”,在现场刘庆峰还演示了利用产品语音订票、改签、开空调、关加湿器、批妀作文等等,俨然一个生活的智能助手并在没有屏幕的情况下,通过语音去实现交互——一定程度上智能手机也可能成为被人工智能顛覆的产业。

  在担心越来越聪明的机器和人之间的关系时科大讯飞 录音笔研究院院长胡郁表示:“我们担心机器越来越聪明了会不會威胁到人类、伤害到人类?但和人一样当学习的越多,会变得越理性情绪也会得到最大程度的控制。”(李根)

}

我要回帖

更多关于 讯飞 录音笔 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信