腾讯云FPGA如何使用腾讯云服务器搭建个人网站怎么买最划算

腾讯云的云服务器、GPU云服务器、fpga云服务器有什么不同?在哪买? - 知乎有问题,上知乎。知乎作为中文互联网最大的知识分享平台,以「知识连接一切」为愿景,致力于构建一个人人都可以便捷接入的知识分享网络,让人们便捷地与世界分享知识、经验和见解,发现更大的世界。4被浏览158分享邀请回答赞同 添加评论分享收藏感谢收起深度学习 机器学习 人工智能 GPU服务器出租gpugo.top赞同 添加评论分享收藏感谢收起写回答腾讯云推出FPGA云IP市场服务,助力FPGA云服务落地更多行业
FPGA云服务,作为云计算产品中一种新型的行业解决方案,具有性能优越、开发便捷、计费灵活等红利,加之其具有低延迟,高吞吐等能力,在基因、人工智能、等计算密集型领域得到广泛使用。2017年1月,腾讯云推出国内首款高性能异构计算基础设施,并致力于FPGA整个云服务生态圈的建设。现阶段腾讯云FPGA云已经形成“云+行业”的发展思路,并已经在教育、基因等行业率先铺开。
传统FPGA开发,每家公司都有自己的一套硬件接口规范、驱动和上层接口,除此之外设计往往很难跨平台和器件直接使用,对于每次移植均需面临时间长和难度大等风险。统一标准将是对FPGA产业的一次划时代的整合和革新。
而在整个FPGA云“生态系统”里面,IP如同百货店里面的商品,没有大量的IP应用,自然也很难吸引到人群从浏览到购买,到最终的使用和评价。所以如何建立起FPGA IP市场成为整个FPGA云“生态系统”发展的关键。
然而FPGA IP市场建立也将面临诸多挑战:
FPGA云服务是一个新的商业模式,其中IP要以下载文件的方式,通过FPGA云下载到FPGA板卡上运行,所以IP的下载文件是通过云服务器厂商提供给最终用户。IP提供商因为担心产权泄露,对云服务器厂商有安全上的疑虑,如何解决IP安全问题,成为FPGA IP市场发展的关键。
FPGA IP运行在FPGA板卡上,由于各家FPGA硬件平台不一样,导致IP开发商需要重新针对目标平台修改现有的设计。而与软件移植不同的是,FPGA的设计是精确到时钟周期,每个时钟周期不同的模块并发完成不同的操作。这就会涉及到从上层的系统层到底层的硬件时序的修改,也意味着IP开发商需要花费大量时间和精力在跨硬件平台移植上。
基于此,腾讯云在FPGA IP市场上带来了一系列创新举措。
FPGA云系统提供源代码加密保护,用户下载文件加密保护以及DNA认证等安全手段。
以赛灵思的FPGA为例子,对于用户源代码,可以通过赛灵思提供的Vivado编译工具进行加密,该Vivado编译工具的加密标准是基于IEEE-1735标准;对于用户的下载文件,可以用DNA认证进行加密保护。目前腾讯云上所有的FPGA器件都有Device DNA,这是一个96 bit的二进制序列,在FPGA器件生产的时候烧死到芯片里面,每个芯片都是唯一的。这个序列,用户可以通过内部的逻辑直接读出。用户利用DNA唯一性,只有授权的DNA序列才能运行用户IP,从而实现IP的保护(参见图1)。
图表 1 FPGA云安全
设计之初,FPGA云系统需要解决的一个重要问题就是通用性。通用性包括两层目标。第一,能够做到FPGA系统架构的通用。第二,能够做到用户接口的通用。最终让用户的设计“无感知”的运行在不同平台和不同类型的FPGA器件,减少移植的代价。
FPGA云系统包含两大区域,即静态区域和动态区域。静态区域虽然对于用户不可见,但是它却是整个系统架构的关键,构建起与上层PC侧的软件和FPGA侧动态区用户IP沟通桥梁,静态区域主要完成包括PCIe协议控制器、DMA数据传输、控制器、中断处理、地址管理模块和总线管理和适配模块、动态加载模块和一些系统调试模块等。动态区域对应的则是用户的IP,这里采用业界通用的AXI总线进行互联。如果采用私有的或者不通用的总线进行互联,用户往往需要对总线协议重新进行理解和开发,而且很难做到很好的系统可扩展性。APIs采用统一的外部接口与用户程序交互,用户不需要把精力花在驱动集成、调试和封装等繁琐细节,只需要专注于高附加值的上层应用和服务开发上(参见图2)。
图表 2 FPGA云开发框架
目前腾讯云FPGA云服务市场,已经有恒扬数据、联捷计算科技、菲数科技等多位伙伴加入,通过IP市场方式提供一系列行业解决方案,为用户提供性价比更高的加速方案,进一步完善FPGA云服务生态圈(参加图3)。
图3 IP市场提供行业解决方案
腾讯云FPGA云服务IP市场已在基因、图片视频、教育等行业和场景中落地。
基因行业解决方案
基因组测序是一种新型基因检测技术,它可以从血液或者唾液中分析测定基因全序列,用来预测疾病,个人的行为特征等等。随着测序成本不断降低并逼近数据分析成本,同时随着近年基因数据量爆发式增长,数据分析成为瓶颈,而传统方法计算速度慢,效率低,因此高性能计算势在必行。
常规的1个人类全基因组(上几百G数据)即使在一个高端服务器运算时间也至少需要几天左右时间,而腾讯推出的“云+基因”原生态解决方案通过对二代测序流程进行硬件加速来解决生物计算量的性能瓶颈。传统方法一个全基因组计算纯软件方案需要大约60小时,腾讯“云+基因”原生态解决方案将时间降到26小时以内。目前该方案已经在基因领域已经落地并成功稳定应用中。
图片视频解决方案
我们所知道的图片压缩算法有:JPEG、WEBP、H264(帧内压缩)、H265(帧内压缩)。它们对应的压缩能力大小分别是:JPEG & WEBP/H264(帧内压缩) & H265(帧内压缩)。H265(帧内压缩)的压缩率和WEBP/H264(帧内压缩)相比提高20~30%左右,和JPEG相比提高50%左右。但是这个压缩能力是通过计算复杂度的提高来实现,其中WEBP、H265的计算复杂度是更是JPEG压缩的10倍以上。
随着智能的普及,图片、视频的产生和分享已经是人们普遍的娱乐方式。而对于互联网服务商和用户来说,图片和视频的不断累积,也为带宽和流量带来越来越多的负担和需求消耗。
腾讯FPGA云通过更高压缩比的H265(帧内压缩)方案,使用FPGA对图片转码进行加速,增强图片转码能力,在互联网图片处理业务中,尽可能的压缩图片,减少图片存储和传输分发的数据量,既节省用户带宽,也可以提高用户下载图片的速度,让互联网服务商和用户以更低的投入, 获得更好的体验。
某视频内容提供商,在线业务中需要进行JPEG图片转WEBP图片的转码服务,为了满足处理延时和吞吐的要求,采用了腾讯FPGA云进行图片转码服务。在腾讯FPGA云上进行的灰度测试,结果显示:JPEG图片转WEBP图片,测试图片大小为,FPGA处理延时相比降低3倍,FPGA处理性能是CPU机器的7倍。
教育行业解决方案
传统FPGA教学和科研长期受制于硬件电路板、开发软件更新换代很快,陈旧教学环境与实际需求以及企业生产环境脱节,申购流程繁琐和时间长等难题。从产业发展的角度,由于缺乏统一的硬件平台,FPGA底层重复劳动多,面向应用开发的少,硬件开源发展缓慢,FPGA个体教学和科研成果也很难为企业带来收益,也严重影响了FPGA行业的长久发展。
日,在OpenHW Contest and Professor Conference 2017上,腾讯云携手依元素科技,与国家电工教学示范中心——东南大学电工电子实验中心合作,落地国内首个基于FPGA云服务的科研项目。
这是国内首个基于FPGA云服务的科研项目,也是是国内FPGA云服务落地具体场景的首个成功案例,同时还是传统的FPGA从技术平台走向具体行业并成功实践的一个重要开端。基于腾讯云提供的FPGA计算服务,东南大学科研人员能够在一个开源的系统平台进行具有高附加值的教学和研究。同时,腾讯云还提供一套开放HDK/SDK,缩短使用者开发时间,助力高校FPGA理论研究成果迅速转化。
腾讯“FPGA云+教育”,通过不断丰富和完善FPGA云+课堂以及线上实验室等多个主题,最终将FPGA云产品落地到各大高等院校的课程和科研当中,目前FPGA云已经成功应用在东南大学数字电路课程中。后续,还将推动在全国范围内300多所高校的合作,让FPGA云服务走进校园和科研实验室,助力高校在FPGA教学和科研的改革,提升高校人才的整体竞争力。
FPGA云是云计算2.0时代应运而生的“芯”力量,在人工智能、基因、大数据等众多领域拥有广阔的前景和业界成功的案例,伴随着近年来云计算和人工智能的浪潮,FPGA云将走进公众的视野。FPGA云完善的IP市场生态圈、成熟的云架构和行业领先的解决方案,将吸引更多云客户愿意尝试这种“芯”技术带来的红利,铸造出扎根于行业的成功解决方案。
责任编辑:祁星晨
免责声明: 凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。【干货】腾讯云FPGA的深度学习算法
稿源:用户投稿
由腾讯云基础产品中心、腾讯架构平台部组成的腾讯云FPGA联合团队,在这里介绍国内首款FPGA云服务器的工程实现深度学习算法(AlexNet),讨论深度学习算法FPGA硬件加速平台的架构。背景是这样的:在1 月 20 日,腾讯云推出国内首款高性能异构计算基础设施——FPGA
云服务器,将以云服务方式将大型公司才能长期支付使用的 FPGA
普及到更多企业,企业只需支付相当于通用CPU约40%的费用,性能可提升至通用CPU服务器的30倍以上。具体分享内容如下:1.综述2016年3月份AI围棋程序AlphaGo战胜人类棋手李世石,点燃了业界对人工智能发展的热情,人工智能成为未来的趋势越来越接近。人工智能包括三个要素:算法,计算和数据。人工智能算法目前最主流的是深度学习。计算所对应的硬件平台有:CPU、GPU、FPGA、ASIC。由于移动互联网的到来,用户每天产生大量的数据被入口应用收集:搜索、通讯。我们的QQ、微信业务,用户每天产生的图片数量都是数亿级别,如果我们把这些用户产生的数据看成矿藏的话,计算所对应的硬件平台看成挖掘机,挖掘机的挖掘效率就是各个计算硬件平台对比的标准。最初深度学习算法的主要计算平台是 CPU,因为 CPU
通用性好,硬件框架已经很成熟,对于程序员来说非常友好。然而,当深度学习算法对运算能力需求越来越大时,人们发现 CPU
执行深度学习的效率并不高。CPU
为了满足通用性,芯片面积有很大一部分都用于复杂的控制流和Cache缓存,留给运算单元的面积并不多。这时候,GPU
进入了深度学习研究者的视野。GPU原本的目的是图像渲染,图像渲染算法又因为像素与像素之间相对独立,GPU提供大量并行运算单元,可以同时对很多像素进行并行处理,而这个架构正好能用在深度学习算法上。GPU 运行深度学习算法比 CPU
快很多,但是由于高昂的价格以及超大的功耗对于给其在IDC大规模部署带来了诸多问题。有人就要问,如果做一个完全为深度学习设计的专用芯片(ASIC),会不会比
更有效率?事实上,要真的做一块深度学习专用芯片面临极大不确定性,首先为了性能必须使用最好的半导体制造工艺,而现在用最新的工艺制造芯片一次性成本就要几百万美元。去除资金问题,组织研发队伍从头开始设计,完整的设计周期时间往往要到一年以上,但当前深度学习算法又在不断的更新,设计的专用芯片架构是否适合最新的深度学习算法,风险很大。可能有人会问Google不是做了深度学习设计的专用芯片TPU?从Google目前公布的性能功耗比提升量级(十倍以上的提升)上看,还远未达到专用处理器的提升上限,因此很可能本质上采用是数据位宽更低的类GPU架构,可能还是具有较强的通用性。这几年,FPGA
就吸引了大家的注意力,亚马逊、facebook等互联网公司在数据中心批量部署了FPGA来对自身的深度学习以云服务提供硬件平台。FPGA 全称「可编辑门阵列」(Field Programmable Gate Array),其基本原理是在 FPGA
芯片内集成大量的数字电路基本门电路以及存储器,而用户可以通过烧写 FPGA
配置文件来来定义这些门电路以及存储器之间的连线。这种烧入不是一次性的,即用户今天可以把 FPGA
配置成一个图像编解码器,明天可以编辑配置文件把同一个 FPGA 配置成一个音频编解码器,这个特性可以极大地提高数据中心弹性服务能力。所以说在
可以快速实现为深度学习算法开发的芯片架构,而且成本比设计的专用芯片(ASIC)要便宜,当然性能也没有专用芯片(ASIC)强。ASIC是一锤子买卖,设计出来要是发现哪里不对基本就没机会改了,但是
FPGA 可以通过重新配置来不停地试错知道获得最佳方案,所以用 FPGA 开发的风险也远远小于 ASIC。2.Alexnet 算法分析 2.1&&& Alexnet模型结构Alexnet模型结构如下图2.1所示。图2.1 Alexnet模型模型的输入是3x224x224大小图片,采用5(卷积层)+3(全连接层)层模型结构,部分层卷积后加入Relu,Pooling
和Normalization层,最后一层全连接层是输出1000分类的softmax层。如表1所示,全部8层需要进行1.45GFLOP次乘加计算,计算方法参考下文。表2.1 Alexnet浮点计算量2.2Alexnet 卷积运算特点Alexnet的卷积运算是三维的,在神经网络计算公式: y=f(wx+b)
中,对于每个输出点都是三维矩阵w(kernel)和x乘加后加上bias(b)得到的。如下图2.2所示,kernel的大小M=Dxkxk,矩阵乘加运算展开后
y = x[0]*w[0]+
x[1]*w[1]+…+x[M-1]*w[M-1],所以三维矩阵运算可以看成是一个1x[M-1]矩阵乘以[M-1]x1矩阵。图2.2 Alexnet三维卷积运算每个三维矩阵kernel和NxN的平面上滑动得到的所有矩阵X进行y=f(wx+b)运算后就会得到一个二维平面(feature
map)如图2.3 所示。水平和垂直方向上滑动的次数可以由 (N+2xp-k)/s+1
得到(p为padding的大小),每次滑动运算后都会得到一个点。a)N是NxN平面水平或者垂直方向上的大小;b)K是kernel在NxN平面方向上的大小kernel_size;c)S是滑块每次滑动的步长stride;图2.3 kernel进行滑窗计算Kernel_num 个 kernel 经过运算后就会得到一组特征图,重新组成一个立方体,参数H = Kernel_num,如图2.4所示。这个卷积立方体就是卷积所得到的的最终输出结果。图2.4 多个kernel进行滑窗计算得到一组特征图3.AlexNet模型的FPGA实现 3.1 FPGA异构平台图3.1为异构计算平台的原理框图,CPU通过PCIe接口对FPGA传送数据和指令,FPGA根据CPU下达的数据和指令进行计算。在FPGA加速卡上还有DDR DRAM存储资源,用于缓冲数据。图3.1 FPGA异构系统框图3.2 CNN在FPGA的实现 3.2.1 将哪些东西offload到FPGA计算?在实践中并不是把所有的计算都offload到FPGA,而是只在FPGA中实现前5层卷积层,将全连接层和Softmax层交由CPU来完成,主要考虑原因:(1) 全连接层的参数比较多,计算不够密集,要是FPGA的计算单元发挥出最大的计算性能需要很大的DDR带宽;(2) 实际运用中分类的数目是不一定的,需要对全连阶层和Softmax层进行修改,将这两部分用软件实现有利于修改。3.2.2 实现模式Alexnet的5个卷积层,如何分配资源去实现它们,主要layer并行模式和layer串行模式:(1)
Layer并行模式:如图3.2所示,按照每个layer的计算量分配不同的硬件资源,在FPGA内同时完成所有layer的计算,计算完成之后将计算结果返回CPU。优点是所有的计算在FPGA中一次完成,不需要再FPGA和DDR
DRAM直接来回读写中间结果,节省了的DDR带宽。缺点就是不同layer使用的资源比较难平衡,且layer之间的数据在FPGA内部进行缓冲和格式调整也比较难。另外,这种模式当模型参数稍微调整一下(比如说层数增加)就能重新设计,灵活性较差。图3.2 layer并行模式下资源和时间分配示意图(2)
Layer串行模式:如图3.3所示,在FPGA中只实现完成单个layer的实现,不同layer通过时间上的复用来完成。优点是在实现时只要考虑一层的实现,数据都是从DDR读出,计算结果都写回DDR,数据控制比较简单。缺点就是因为中间结果需要存储在DDR中,提高了对DDR带宽的要求。&图3.3 layer并行模式下资源和时间分配示意图我们的设计采用了是Layer串行的模式,数据在CPU、FPGA和DDR直接的交互过程如图3.4所示。图3.4 计算流程图3.2.3 计算单个Layer的PM(Processing Module)设计如图3.5所示,数据处理过程如下,所有过程都流水线进行:(1) Kernel和Data通过两个独立通道加载到CONV模块中;(2) CONV完成计算,并将结果存在Reduce RAM中;(3) (可选)如果当前layer需要做ReLU/Norm,将ReLU/Norm做完之后写回Reduce RAM中;(4) (可选)如果当前layer需要做Max Pooling,将Max做完之后写回Reduce RAM中;(5) 将计算结果进行格式重排之后写回DDR中。图3.5 Processing Module的结构框图3.2.4 CONV模块的设计在整个PM模块中,最主要的模块是CONV模块,CONV模块完成数据的卷积。由图3.6所示,卷积计算可以分解成两个过程:kernel及Data的展开和矩阵乘法。Kernel可以预先将展开好的数据存在DDR中,因此不需要在FPGA内再对Kernel进行展开。Data展开模块,主要是将输入的feature
map按照kernel的大小展开成可以同kernel进行求内积计算的矩阵。数据展开模块的设计非常重要,不仅要减小从DDR读取数据的数据量以减小DDR带宽的要求,还要保证每次从DDR读取数据时读取的数据为地址连续的大段数据,以提高DDR带宽的读取效率。图3.6 卷积过程示意图图3.7为矩阵乘法的实现结构,通过串联乘加器来实现,一个周期可以完成一次两个向量的内积,通过更新端口上的数据,可以实现矩阵乘法。图3.7 矩阵乘法实现结构展开后的矩阵比较大,FPGA因为资源结构的限制,无法一次完成那么的向量内积,因此要将大矩阵的乘法划分成几个小矩阵的乘加运算。拆分过程如图3.8所示。假设大矩阵乘法为O= X*W,其中,输入矩阵X为M*K个元素的矩阵;权重矩阵W为K*P个元素的矩阵;偏置矩阵O为M*P个元素的矩阵;图3.8 大矩阵乘法的拆分过程R = K/L,如果不能整除输入矩阵,权重矩阵和偏置通过补零的方式将矩阵处理成可以整除;S = P/Q,如果不能整除将权重矩阵和偏置矩阵通过补零的方式将矩阵处理成可以整除;3.2.5实现过程的关键点(1) 决定系统性能的主要因素有:DSP计算能力,带宽和片内存储资源。好的设计是将这三者达到一个比较好的平衡。参考文献[2]开发了roofline性能模型来将系统性能同片外存储带宽、峰值计算性能相关联。(2)
为了达到最好的计算性能就是要尽可能地让FPGA内的在每一个时钟周期都进行有效地工作。为了达到这个目标,CONV模块和后面的ReLU/Norm/Pooling必须能异步流水线进行。Kernel的存储也要有两个存储空间,能对系数进行乒乓加载。另外,由于计算是下一层的输入依赖于上一层的输出,而数据计算完成写回DDR时需要一定时间,依次应该通过交叠计算两张图片的方式(Batch=2)将这段时间通过流水迭掉。(3) 要选择合适的架构,是计算过程中Data和Kernel只要从DDR读取一次,否则对DDR带宽的要求会提高。3.3 性能及效益如图3.9所示采用FPGA异构计算之后,FPGA异构平台处理性能是纯CPU计算的性能4倍,而TCO成本只是纯CPU计算的三分之一。本方案对比中CPU为2颗E5-2620,FPGA为Virtex-7
VX690T,这是一个28nm器件,如果采用20nm或16nm的器件会得到更好的性能。图 3.9 计算性能对比图 3.10 归一化单位成本对比图3.11为实际业务中利用FPGA进行加速的情况,由图中数据可知FPGA加速可以有效降低成本。图3.11 某实际业务中的性能和成本对比参考文献[1] Alex Krizhevsky. ImageNet Classification with Deep Convolutional Neural Networks[2] C. Zhang, et al. Optimizing FPGA-based accelerator design for deep convolutional neural networks. In ACM ISFPGA 2015.&[3] P Gysel, M Motamedi, S Ghiasi. Hardware-oriented Approximation of Convolutional Neural Networks. 2016.[4] Song Han,Huizi Mao,William J. Dally.DEEP COMPRESSION: COMPRESSING
DEEP NEURAL NETWORKS WITH PRUNING, TRAINED QUANTIZATION AND HUFFMAN
CODING. Conference paper at ICLR,2016
本文由站长之家用户投稿,未经站长之家同意,严禁转载。如广大用户朋友,发现稿件存在不实报道,欢迎读者反馈、纠正、举报问题()。
免责声明:本文为用户投稿的文章,站长之家发布此文仅为传递信息,不代表站长之家赞同其观点,不对对内容真实性负责,仅供用户参考之用,不构成任何投资、使用等行为的建议。请读者使用之前核实真实性,以及可能存在的风险,任何后果均由读者自行承担。如有发现
有好的文章希望站长之家帮助分享推广,猛戳这里
本网页浏览已超过3分钟,点击关闭或灰色背景,即可回到网页腾讯云的GPU云服务器、腾讯云fpga云服务器区别在哪?在哪买购买价格更优惠? - 知乎有问题,上知乎。知乎作为中文互联网最大的知识分享平台,以「知识连接一切」为愿景,致力于构建一个人人都可以便捷接入的知识分享网络,让人们便捷地与世界分享知识、经验和见解,发现更大的世界。3被浏览151分享邀请回答赞同 添加评论分享收藏感谢收起国内首个二代基因测序FPGA加速方案落地腾讯云
发表于 13:56|
摘要:伴随着基因测序技术的快速发展,基因数据的生成呈现指数级增长,对分析能力提出更高要求。近日,腾讯云正式推出国内首个基于自研 FPGA 极光技术的 NGS 加速方案,极大提升人类全基因组分析效率,有效改善基因领域数据分析速度慢、效率低等问题。 腾讯云全面赋能改善基因领域难题 基因测序作为一...
& & &&伴随着基因测序技术的快速发展,基因数据的生成呈现指数级增长,对分析能力提出更高要求。近日,腾讯云正式推出国内首个基于自研FPGA极光技术的NGS加速方案,极大提升人类全基因组分析效率,有效改善基因领域数据分析速度慢、效率低等问题。
腾讯云全面赋能改善基因领域难题
基因测序作为一种新型的基因检测技术,在生命科学研究中扮演着十分重要的角色,行业的蓬勃发展催生了生物基因数据爆炸式的增长,使得基因企业、科学工作者等面临新的挑战。日前,腾讯云表示将全面开放各项IT能力,在传输、存储、计算、管理和洞察等方面,助力生物基因领域全面快速发展。
首先,面对基因数据量的传输难题,腾讯云建成国内最全的28线BGP网络环境,使基因客户快速稳定地上传和下载数据,同时还能帮助基因企业客户做数据上云,通过一键分发的功能让基因企业将数据传递给科研用户。其次,腾讯云通过提供文件存储、对象存储和归档存储等存储服务,满足基因领域客户面对不同的数据使用场景和需求,而针对最核心的计算环节,腾讯云提供超算云服务,使科研工作者和基因企业能够选择多种高性能的虚拟机和物理机来加速基因计算。
除此之外,腾讯云为基因行业专门开发了一体化的数据管理平台&腾讯云双螺旋PAAS平台&,满足基因用户传、存、算、管等需求。据了解,腾讯云双螺旋平台具有三大特点。首先是快速分析,通过在双螺旋上使用FPGA来加速基因分析过程,对二代测序,已经可以节省90%的时间,后续会继续推出三代加速的服务。其次是节省费用,依托双螺旋的精准调度能力,双螺旋会在计算过程中按需调度最匹配的算力执行任务,避免出现CPU或内存大量空跑情况。第三是人工智能技术的赋能,已在精准医疗领域落地。例如,在广东,AI腾讯觅影在帮助医生做早期食道癌的筛查,对一张内镜检查影响,觅影AI可以在4秒内做出诊断,准确率达到90%。
(图注:腾讯双螺旋PAAS平台特点示意图)
NGS加速方案,提升人类全基因组分析效率与分析准确率
腾讯云基因团队近日推出的基于自研FPGA极光异构系统的NGS加速方案,可将人类全基因组分析从30小时优化到2.8小时。在实验过程中,研究人员采用一份30倍测序深度的人类全基因组FASTQ文件(NA12878),分别在业界常用的通用高性能服务器与搭载FPGA极光异构系统的服务器上进行了对比测试,实验数据表明,腾讯NGS加速方案加速比超过10倍。
(图1:传统计算系统与腾讯极光异构系统对比)
据了解,传统的计算系统通过采用多个高端CPU搭建HPC系统实现了缩短时间的目的,但这样也使得成本增加,基因企业规模受限。而腾讯极光异构系统在提供卓越性能的同时,还能进一步降低基因客户的成本。它采用自研核心技术极光(Aurora Technology),通过以下三个方面整体优化传统的分析和计算流程。
第一,搭载BWA_MEM和Variant Calling专用硬件算法核。采用业界顶尖的大规模集成电路设计技术,把算法性能提升了一个台阶。
第二,算法级优化内存访问的方式。
第三,IO瓶颈导致系统性能无法提升一直是基因二代分析流程的一大痛点,通过系统和算法级别优化以及异构加速大幅降低IO带宽需求。
(图注:腾讯极光技术原理解析)
在极大提升分析效率的同时,极光技术还保证了优异的分析准确率,与传统软件分析准确率基本一致。研究人员将通用服务器和极光异构系统上计算得出的分析结果,上传PrecisionFD网站进行比对。比对结果如下图2和图3所示:
(图2:通用处理器测试结果)
(图3:极光异构系统测试结果)
满足不同场景应用需求,助力基因客户商业成功
腾讯云依托在云计算、大数据、人工智能等领域的丰富经验和积累,能够满足不同类型基因用户的不同场景和模式需求的能力,使其生物基因生态解决方案已成为众多生命科学领域用户的优先选择。这其中就包括诺禾致源、碳云智能、格致基因等,腾讯云,正在以智能解决方案推动着生命科学行业的发展。
致力于生命科学研究与人类健康领域的诺禾致源,利用腾讯超算云精准匹配所需资源,满足其在基础科研、基因数据处理及临床应用等不同应用场景和模式下对数据处理、存储和传输的严苛要求,帮助科研和医疗人员更专注解决科学和临床问题。
碳云智能作为生命科学领域的创新公司,依托腾讯云在互联网和人工智能等方面的优势,以及弹性、高效、低延迟的在线计算和大数据处理领先能力,建立了一个包括生物样本管理系统、分析计算系统、用户数据管理系统等在内的数字生命的大数据平台。运用人工智能技术分析、处理数据、寻找碳基生命的硅基未来,帮助每一个人管理数字生命健康。
针对基因科学领域企业伙伴的不同量级,腾讯云不断推出高性价比产品满足需求。格致基因合伙人黄柯表示,腾讯云提供的黑石实体结合虚拟机弹性计算的方案,很好地满足了低成本高性能计算需求,在生命科学新领域提供高质量服务,为初创公司提供了良好的解决方案。
腾讯云一直致力于为客户提供行业领先的解决方案,助力客户解决所遇到的瓶颈。在基因科学领域,腾讯云表示未来将会推出更多服务,进一步降低基因客户的成本和提升整体性能。据了解,腾讯云极光FPGA加速能力将通过双螺旋产品进行开放,目前已开放体验测试预约,您可扫描下方二维码进行预约,先人一步体验,享受更多优惠。
CSDN官方微信
扫描二维码,向CSDN吐槽
微信号:CSDNnews
相关热门文章}

我要回帖

更多关于 如何使用腾讯云服务器搭建个人网站 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信