大数据系统架构架构哪家比较好

点击联系发帖人 时间：2017-12-28 14:53

大数据架构图

大数据培训机构哪家比较好啊，要靠谱一点的_百度知道
大数据培训机构哪家比较好啊，要靠谱一点的
我有更好的答案
最好选择覆盖地区广的，比较权威的培训机构。大数据的专业要求很高：Hadoop，大数据存储，大数据架构设计，大数据实时计算，大数据数据采集，大数据商业实战等。目前敢培训大数据的学校都是具备一定专业性的，主要看看是否能提供真实的案例来供学生们分析来进行专业性的判断。多看看网络上的口碑。找到真正适合自己的培训机构。需要掌握的专业技术：坚实的Java技术作为基础支持，之后学习这个要看你在哪个城市了，每个城市所存在的机构都不一样
做有温度教育,打造IT届黄埔军校
主营：IT培训、java培训、大数据培训、web前端培训、UI培训
那就选择学校遍布全国大型的it培训品牌就好了。
为您推荐：
其他类似问题
您可能关注的内容
换一换
回答问题，赢新手礼包
个人、企业类
违法有害信息,请在下方选择后提交
色情、暴力
我们会通过消息、邮箱等方式尽快将举报结果通知您。你一定需要六款大数据采集平台的架构分析
你好，游客
你一定需要六款大数据采集平台的架构分析
来源：36大数据&
　　随着越来越被重视，数据采集的挑战变的尤为突出。今天为大家介绍几款数据采集平台：
　　Apache Flume
　　Fluentd
　　Logstash
　　Chukwa
　　Scribe
　　Splunk Forwarder
　　大数据平台与数据采集
　　任何完整的大数据平台，一般包括以下的几个过程：
　　数据采集
　　数据存储
　　数据处理
　　数据展现(可视化，报表和监控)
　　其中，数据采集是所有数据系统必不可少的，随着大数据越来越被重视，数据采集的挑战也变的尤为突出。这其中包括：
　　数据源多种多样
　　数据量大，变化快
　　如何保证数据采集的可靠性的性能
　　如何避免重复数据
　　如何保证数据的质量
　　我们今天就来看看当前可用的六款数据采集的产品，重点关注它们是如何做到高可靠，高性能和高扩展。
　　1、Apache Flume
　　官网：https://flume.apache.org/
　　Flume 是Apache旗下的一款开源、高可靠、高扩展、容易管理、支持客户扩展的数据采集系统。 Flume使用JRuby来构建，所以依赖Java运行环境。
　　Flume最初是由Cloudera的工程师设计用于合并日志数据的系统，后来逐渐发展用于处理流数据事件。
　　Flume设计成一个分布式的管道架构，可以看作在数据源和目的地之间有一个Agent的网络，支持数据路由。
　　每一个agent都由Source，Channel和Sink组成。
　　Source
　　Source负责接收输入数据，并将数据写入管道。Flume的Source支持HTTP，JMS，RPC，NetCat，Exec，Spooling Directory。其中Spooling支持监视一个目录或者文件，解析其中新生成的事件。
　　Channel
　　Channel 存储，缓存从source到Sink的中间数据。可使用不同的配置来做Channel，例如内存，文件，JDBC等。使用内存性能高但不持久，有可能丢数据。使用文件更可靠，但性能不如内存。
　　Sink负责从管道中读出数据并发给下一个Agent或者最终的目的地。Sink支持的不同目的地种类包括：HDFS，HBASE，Solr，ElasticSearch，File，Logger或者其它的Flume Agent。
　　Flume在source和sink端都使用了transaction机制保证在数据传输中没有数据丢失。
　　Source上的数据可以复制到不同的通道上。每一个Channel也可以连接不同数量的Sink。这样连接不同配置的Agent就可以组成一个复杂的数据收集网络。通过对agent的配置，可以组成一个路由复杂的数据传输网络。
　　配置如上图所示的agent结构，Flume支持设置sink的Failover和Load Balance，这样就可以保证即使有一个agent失效的情况下，整个系统仍能正常收集数据。
　　Flume中传输的内容定义为事件(Event)，事件由Headers(包含元数据，Meta Data)和Payload组成。
　　Flume提供SDK，可以支持用户定制开发：
　　Flume客户端负责在事件产生的源头把事件发送给Flume的Agent。客户端通常和产生数据源的应用在同一个进程空间。常见的Flume客户端有Avro，log4J，syslog和HTTP Post。另外ExecSource支持指定一个本地进程的输出作为Flume的输入。当然很有可能，以上的这些客户端都不能满足需求，用户可以定制的客户端，和已有的FLume的Source进行通信，或者定制实现一种新的Source类型。
　　同时，用户可以使用Flume的SDK定制Source和Sink。似乎不支持定制的Channel。
　　2、Fluentd
　　官网：http://docs.fluentd.org/articles/quickstart
　　Fluentd是另一个开源的数据收集框架。Fluentd使用C/Ruby开发，使用JSON文件来统一日志数据。它的可插拔架构，支持各种不同种类和格式的数据源和数据输出。最后它也同时提供了高可靠和很好的扩展性。Treasure Data, Inc 对该产品提供支持和维护。
　　Fluentd的部署和Flume非常相似：
　　Fluentd的架构设计和Flume如出一辙：
　　Fluentd的Input/Buffer/Output非常类似于Flume的Source/Channel/Sink。
　　Input负责接收数据或者主动抓取数据。支持syslog，http，file tail等。
　　Buffer
　　Buffer负责数据获取的性能和可靠性，也有文件或内存等不同类型的Buffer可以配置。
　　Output
　　Output负责输出数据到目的地例如文件，AWS S3或者其它的Fluentd。
　　Fluentd的配置非常方便，如下图：
　　Fluentd的技术栈如下图：
　　FLuentd和其插件都是由Ruby开发，MessgaePack提供了JSON的序列化和异步的并行通信RPC机制。
　　Cool.io是基于libev的事件驱动框架。
　　FLuentd的扩展性非常好，客户可以自己定制(Ruby)Input/Buffer/Output。
　　Fluentd从各方面看都很像Flume，区别是使用Ruby开发，Footprint会小一些，但是也带来了跨平台的问题，并不能支持Windows平台。另外采用JSON统一数据/日志格式是它的另一个特点。相对去Flumed，配置也相对简单一些。
　　3、Logstash
　　/elastic/logstash
　　Logstash是著名的开源数据栈ELK (ElasticSearch, Logstash, Kibana)中的那个L。
　　Logstash用JRuby开发，所有运行时依赖JVM。
　　Logstash的部署架构如下图，当然这只是一种部署的选项。
　　一个典型的Logstash的配置如下，包括了Input，filter的Output的设置。
　　几乎在大部分的情况下ELK作为一个栈是被同时使用的。所有当你的数据系统使用ElasticSearch的情况下，logstash是首选。
　　4、Chukwa
　　官网：https://chukwa.apache.org/
　　Apache Chukwa是apache旗下另一个开源的数据收集平台，它远没有其他几个有名。Chukwa基于Hadoop的HDFS和Map Reduce来构建(显而易见，它用Java来实现)，提供扩展性和可靠性。Chukwa同时提供对数据的展示，分析和监视。很奇怪的是它的上一次github的更新事7年前。可见该项目应该已经不活跃了。
　　Chukwa的部署架构如下：
　　Chukwa的主要单元有：Agent，Collector，DataSink，ArchiveBuilder，Demux等等，看上去相当复杂。由于该项目已经不活跃，我们就不细看了。
　　5、Scribe
　　代码托管：/facebookarchive/scribe
　　Scribe是Facebook开发的数据(日志)收集系统。已经多年不维护，同样的，就不多说了。
　　6、Splunk Forwarder
　　官网：/
　　以上的所有系统都是开源的。在商业化的大数据平台产品中，Splunk提供完整的数据采金，数据存储，数据分析和处理，以及数据展现的能力。
　　Splunk是一个分布式的机器数据平台，主要有三个角色：
　　Search Head负责数据的搜索和处理，提供搜索时的信息抽取。
　　Indexer负责数据的存储和索引
　　Forwarder，负责数据的收集，清洗，变形，并发送给Indexer
　　Splunk内置了对Syslog，TCP/UDP，Spooling的支持，同时，用户可以通过开发Script Input和Modular Input的方式来获取特定的数据。在Splunk提供的软件仓库里有很多成熟的数据采集应用，例如AWS，数据库(DBConnect)等等，可以方便的从云或者是数据库中获取数据进入Splunk的数据平台做分析。
　　这里要注意的是，Search Head和Indexer都支持Cluster的配置，也就是高可用，高扩展的，但是Splunk现在还没有针对Farwarder的Cluster的功能。也就是说如果有一台Farwarder的机器出了故障，数据收集也会随之中断，并不能把正在运行的数据采集任务Failover到其它的Farwarder上。
　　我们简单讨论了几种流行的数据收集平台，它们大都提供高可靠和高扩展的数据收集。大多平台都抽象出了输入，输出和中间的缓冲的架构。利用分布式的网络连接，大多数平台都能实现一定程度的扩展性和高可靠性。
　　其中Flume，Fluentd是两个被使用较多的产品。如果你用ElasticSearch，Logstash也许是首选，因为ELK栈提供了很好的集成。Chukwa和Scribe由于项目的不活跃，不推荐使用。
　　Splunk作为一个优秀的商业产品，它的数据采集还存在一定的限制，相信Splunk很快会开发出更好的数据收集的解决方案。
相关新闻 & & &
尊重网上道德，遵守中华人民共和国的各项有关法律法规
承担一切因您的行为而直接或间接导致的民事或刑事法律责任
本站管理人员有权保留或删除其管辖留言中的任意内容
本站有权在网站内转载或引用您的评论
参与本评论即表明您已经阅读并接受上述条款51CTO旗下网站
物联网中的大数据架构、应用案例以及带来的好处
物联网(IoT)是目前大数据市场的最新趋势，在未来十年内，估计会出现约两百五十亿个网络连接设备，这是一个很庞大的连接，因此，影响物联网最大的因素之一就是数据：数据量、数据的管理和使用。
作者：周硕彦来源：| 05:36
近年来&物联网&(IoT)和&大数据&是两个最受瞩目的话题。在物联网的概念里，有关任何开和关切换到网络的设备皆会彼此连接，它们之间都彼此相互连结。这包括了手机、咖啡机、洗衣机、耳机、台灯以及可穿戴的设备，很多物品都是属于这个范畴(图 1)。这也适用于机器零件，例如：飞机的喷气发动机或石油钻井平台的钻头。无论有没有意识到这一点，我们的生活周围已经被这些依赖于大数据的东西所包围了，不过这也使得生活更美好。
图1 物联网在连接设备的应用 (来源: the IPSO Alliance)
物联网(IoT)是目前大数据市场的最新趋势。在未来十年内，估计会出现约两百五十亿个网络连接设备，比个人计算机、手机和平板计算机等的数量加起来还多，这是一个很庞大的连接(有人甚至估计这个数字还要高得多，超过一千亿)。物联网是连接
&物品& 的巨大网络。这关系是在人与人、人与事、物与物之间。因此，影响物联网最大的因素之一就是数据：数据量、数据的管理和使用，如图2 所示。
图2 物联网连接数据的数量&
二、大数据
大数据是指大量的数据，它是非结构化和没有组织性的，指的是不断增加的数据，且需要收集、储存、管理和分析的技术。这是个复杂的和多层面的现象，影响到人员、流程和技术。从技术的角度来看，大数据整合了组织、管理、分析和显示数据，这些都是&Seven
V&S&的特点。
图3 在 Seven V&S 里面的大数据演变为数据的价值
大数据的数据量，是指从这些来源(文字、声音、视频、社交网络、调查研究、医疗数据、空间意象、犯罪报导、气象预报和自然灾害等等)所收集到的各个数据。而在处理大数据的问题时，数量的多寡是一个关键的因素。
2. 数据输出输入的速度
这个速度影响负责大量数量和数据进来的速度。例如，当发生数据有时间上的紧迫、需要立即处理并迅速保存的时候。
3. 数据类型，多样性
多样性是指数据的不同数据资源和格式，而它不能将自己储存在结构化的关系数据库系统。数据的多样性直接影响数据的完整性。数据中的多样性越复杂，就越容易产生错误。
由于非结构化和大数据的处理应考虑其准确性 -
数据的真实性。而&真实性&将成为最受关注的一项因素，尤其是对于大数据的处理、相关分析以及最后结果这些方面而言。
数据的有效性可能听起来相似于数据的准确性，但概念上却是不同的。有效性意味着数据的正确性和精确度。
能见度指的是能够看到或被看到&它是隐含的。来自不同来源的数据需要合并在一起，而它们是由可见的技术层所组成的大数据。
这是一个非常重要、具有价值或很有用的数据。这个&价值&是大数据处理后所期望的结果。实际上，数据的价值必须超过成本。
大数据技术是一项新的技术和结构，意指在从各种非常大量的数据中获取价值，并透过使用快速采集来发现和/或分析大数据技术层，包括：
基础设施，如储存系统，服务器和数据中心网络基础结构
数据组织和管理软件
分析和搜寻软件
决策辅助和自动化软件
服务器包含业务咨询、业务流程外包、IT 外包、以 IT 项目为基础的服务、IT 辅助和培训有关大数据如何运用。
图4 大数据在物联网中的角色
如果没有适当的把数据收集到位，对企业而言将不能排序所有在嵌入式传感器(图 4)中流动的信息流。这意味着，如果没有大数据，物联网仅可提供企业一点点东西。要引进先进的物联网使用案例，其关键在于：在一般情况下进行数据分析、要能从想象中到实际上可以实施、借助进入到数据基础结构，来达到经济实惠和易维护性。
8. 大数据架构
新大数据结构是弥补传统系统中的不足之处，但也增加了整体的复杂性。这种技术使公司能够分配数据的储存与数据的分析，并分析有效性以及辨识模式、趋势等。公司不仅能够进行历史分析和回馈导向的报告，同时也期待着，预测商业的见解，从而积极支持未来的决策。多数专业系统需要处理不同的需求和方法。特别是对于物联网而言，M2M
和传感器的数据，因为数据的实时处理和分析是必要的，而且传统系统无法提供其所需，因此内存和流动式数据库的应用程序是必要且不可少的。
大数据的技术结构可以分成六个不同的重点领域，以专业技术为主轴：数据储存、数据存取、数据整合、分析处理、视觉和数据管理。
图5 简易大数据架构
9. 云端运算
而物联网真正的创新来自于它与云端运算的完美结合。当连接设备之间相互发生作用时，大量的数据将产生于此。这些数据很容易地被捕捉到以及储存，但需要将其转化为有价值的知识和可执行的情报&而这是云端真实的实力所在。实际上，云端运算是一个模型，为了足够方便、并依据网络需求权限，来配置运算资源的共享池(如网络，服务器，储存，应用和服务)，它可快速配置和发布最小的管理工作或服务提供商互动。有三种云端服务模式如下(图 6)：
(1)云端软件服务(SaaS)
多数的 SaaS 应用程序，是用来涵盖在所有情况的范围之下企业用户的所需。
(2)云端平台服务(PaaS)
PaaS 提供开发人员工具和知识库构建、测试、配置和在云端基础设施上运行这个应用程序。PaaS 借助无需配置和扩展 Hadoop
的元素来实现降低管理的工作量，并作为先进分析应用程序的开发平台。
(3)云端基础设施服务(IaaS)
IaaS 在共享资源服务器中能分配或拖延时间，这往往是虚拟化，处理的运算和储存需求的大数据分析。
图6 服务模式
三个主要的云架构模型已经随着时间的推移而发展; 私有、公共和混合云(图 7)。它们都共享资源商品化的想法，并为此常常虚拟化的计算和抽象的储存层。
私有云是专用于一个组织，不共享物理资源。此资源可由公司内部或外部提供。私有云配置的典型要求是安全性，严格区分企业的数据储存和处理是否被无意或是恶意进入共享资源。
公共云的数据传输、储存和处理共享实体资源。然而，客户有隐私的可见运算环境和独立储存。安全方面的问题，采用一些私有云或自定义的配置，对绝大多数的客户和项目不相关。
图7 私有和公共云端运算之间的区别
混合云架构合并私有和公共云的配置。通常是为了实施安全性和弹性，或提供更便宜的基本负载和脉冲能力。
云端运算模式提高 IT 的灵敏性，就能节省很多成本。此外，云端运算是一个自由的大数据 -
任何企业都能在规模庞大的数据里与非结构化数据一起运作。云端运算和云端数据储存的兴起，对于大数据的出现而言，将成为一个前兆和推动者。云端运算借助标准化技术方法，来计算时间和数据储存，并商品化。它比传统的物理配置有更显著的优势。然而，云端平台有好几种形式，有时不得不与传统架构一起整合。云端运算运用可视化在同一台实体机器上，来运算资源来以运行许多标准化的虚拟服务器。云端提供者允许低价格和根据短的时间间隔来计费，以实现这一经济规模效益。这种标准化使得计算需求，具有弹性和高可用性的选项。
借助增加附加的实例与服务他们每个人一部份的需求，来垂直扩展以实现弹性。像 Hadoop
的软件是专门为分布式系统来利用垂直扩展，他们在大平行规模里处理小的独立任务。分布式系统也可以作为数据储存，例如 NoSQL 数据库，或文件系统像是 Hadoop
的 HDFS。透过与复杂工作流程的机器集群，可用风暴在接近实时之下提供协调数据流的处理来替代。典型的云端大数据项目的数据处理重点放在缩放或采用 Hadoop。像
Hive 和 Pig 这两个工具已经在 Hadoop 之上，这使得它可行轻松地处理庞大的数据。
三、HADOOP
是一个强大的开放架构，它几乎是由整个大数据堆中许多不同的技术所组成，借着利用正在使用的几个组织，并透过物联网(IoT)来收集分析和处理数据。对于物联网(IoT)收集非结构化数据，这仅仅成功了一半，另一半处理批量，是使用
分析数据。物联网的成功或失败取决于大数据，随着企业步入物联网的世界里，物联网与大数据之间的共生关系被广泛利用在盈利的业务决策上。物联网大部分是关于数据而不是设备中的数据。大数据和物联网就像是战略合作伙伴，因为它们不只是从物联网收集数据，还必须进行处理和分析，以争取改善业务营运。因数据的特性，物联网设备适合用于采用分析大数据的方法。物联网(IoT)的基础设施已经达到了成熟的水平：
无所不在 - 现在传感器已经很便宜，并可被包含在任何系统内。
向外扩展集中计算-Hadoop 可被用于分析、处理和储存所有 IoT 所产生的数据，并具有成本效益的可扩展分布式计算系统。
Hadoop 运用企业级储存处理层，可储存接近一兆的文件。各种相关性可以在不同类型的非结构化数据之间，借助利用 Hadoop
和物联网，从而为企业的竞争优势提升到另一个层级。下图所示的相互作用物联网(IoT)，说明数据储存和大数据分析引擎之间是如何发生的，如图 8。
图8 物联网三要素之间的相互作用
四、物联网的应用和大数据 HADOOP
1. 迪斯尼世界独有的流行魔术手环
迪斯尼世界独有的魔术手环，是物联网如何利用大数据的最佳范例之一。魔术手环是一种可穿戴式的手环，游客可以戴在手腕上，从办理报到手续到他们的房间开始、购买食物、进入主题公园的旋转门。迪斯尼收集有关游客在主题公园内活动的非结构化数据，以将其用于分析，帮助他们
- 工作人员的吸引力和游乐设施的有效性，调节餐厅在尖峰时段的存货，容纳更多的客人进入饭店。
2. 受到大众喜爱的珠宝店 Alex and Ani
Alex and Ani 这两家受到大众喜爱的珠宝店，它们在店内使用 Beacon
的技术来追踪商店内的游客数量和发送特定的折扣券，使顾客一进入到商店中就能发送给他们。
3. Beacon 技术在麦当劳食品供应链
麦当劳是用 Beacon
技术透过顾客的手机应用程序，知道谁在麦当劳餐厅附近，以提供优惠券给客户。顾客收到有个人化种类的讯息，并使用手机应用程序找出最有关联的交易。
4. UPS(联合包裹服务公司)
UPS 是美国最大的运输公司，他们正在利用传感器数据进行大数据分析，以提高办事效率来节省资金，并减少对环境的影响。UPS
在送货车辆上安装传感器来追踪油量行驶里程数，停止和加速的发动机状况。这些物联网传感器从每个车队的每一台车辆采集近 200 个数据点，每一天将近 80,000
个。UPS 已成功地减少有害排放燃料的消耗和减少车辆的空闲时间。
五、运用大数据的案例
现在的大数据技术提供了各种不同的能力。它已经用来创造新产品、预测行为和趋势，并优化销售活动。大数据正在改变各种行业的经营方式，它能提供量身打造的医疗保健，使得我们的城市更智慧、更安全。本节的其余部分将讨论，大数据被用于一些特定的情况。
1. 利用大数据来预测犯罪地点
预测未来犯罪是现在现实的一部分。其中一个例子是洛杉矶警察局(LAPD)在近期利用大数据来预测犯罪地点，因此降低整个大都市区的犯罪，在使用预测软件的区域作出了以下贡献，降低
33%的室内偷窃、21%的暴力犯罪和
12%财产犯罪。当地震发生的时候，在附近会有很高的机率出现余震。这个数学模型，是由一位助理教授乔治莫赫所开发的，它可以用来定义和预测新余震图案。
犯罪数据显示类似的模式(见图 9)。这些数据有助于洛杉矶警察局
LAPD了解犯罪的性质。它表示当犯罪发生在一个地方的时候，就会有更多的犯罪出现在附近，这些犯罪活动的模式，就类似余震模式。当他们把之前的犯罪代入方程式，就会产生在过去预测里发生了什么事。而现在该部门可以透过运算来分析识别犯罪模式，这系统的分析，让暴力犯罪在洛杉矶连续递减。
就像遵循一个地震余震，附近的盗窃也跟着快速重复发生(从洛杉矶 2004/5 的数据)
图9 犯罪余震
2. 以大数据作为医疗保健创新的源泉
大数据的发布可能会激发很多公司开发医疗保健应用程序，或类似的创新。以下是大数据革命创造有关医疗创新的一些例子：
(1) MHealthCoach
支持慢性病照护的病人、提供教育，并透过一个互动系统来治疗。这个应用程序利用医疗保健的成本和项目的数据，这是由卫生保健研究与质量的机构所赞助的，以及来自临床试验的结果和警告。MHealthCoach
也可被供应者用来识别高风险患者，和提供重要的消息并提醒他们(图 10)。
图10 Mhealthcoach
(2) Asthmapolis 创造了一个可使用 GPS 追踪器的东西，它借助哮喘来监测吸入器的使用情况，并在 Google Play 商店和 App
Store 推出了名为Propeller Health 的应用程序(见图 11)。这个 Propeller
传感器会持续追踪患者药物的使用，并随着时间和地点来记录，定位病人使用的吸入器。也可同时用于救援和控制药物症状追踪。这些讯息会被放到中央数据库，并用于识别个人、团体，并基于人口的趋势，合并哮喘催化剂
CDC讯息(例如，在东北花粉计数和火山雾在夏威夷的影响)，以帮助医生制定个别化的治疗方案，并预防突发的状况。该 Propeller
无线传感器与患者的智能手机，会使用内置蓝牙的技术与手机同步。为 iOS(如iPhone 和 iPod Touch)和 Android 设备的 Propeller
手机应用程序可以让病人来查看数据，给他们个人化的回馈和教育的方法，来改善他们的哮喘控制或慢性阻塞性肺病。
图11 Propeller 应用
提供了一个手机应用程序，即患者(如糖尿病患者)同意，与他们的供货商合作，透过他们的手机进行追踪和协助应用程序记录呼叫讯息、简讯、位置，甚至是移动的讯息(图 12)。患者也响应了智能手机的调查。Ginger.io应用程序整合了从美国国立卫生研究院取得的公共研究，和其他健康数据讯息。获得可揭示的见解;例如，缺乏运动或其他活动，可能预示着患者感觉身体不适，和不规则的睡眠模式可能预示着焦虑发作迫在眉梢。
图12 Ginger i.o 的应用
六、大数据为企业和消费者带来的好处
大数据为企业和客户创造价值，这些好处可以在广泛的领域中感受到，不论是大型或小型公司。在大型公司中，有投资大数据技术的几个驱动因素;
分析业务和交易数据，能够收集深入了解网络上顾客的行为，并采用先进的分析来发现，其中 BTO
模式的制造商可以用影响最小的现有生产计划到调度机、工作人员来销售。大数据正由制造商提高保修管理和设备监控，以及优化他们的产品投入市场的物流。零售商正在利用各种各样的客户互动，在线和线下，以提供更有针对性的建议和最优定价。科技公司正在利用大数据来分析数以百万计的数据，以提供更可靠，更准确的语音接口。银行使用大数据技术来提高欺诈检测。
对于顾客而言，大数据创造的产品和服务，影响他们的日常生活。使网络安全专家透过利用大量的网络和应用数据，并用它来识别异常情况和威胁，以保护信用卡系统。近
29%的美国人谁是&无银行账户&或&已经开户&有资格获得信贷额度的使用范围更广，如支付租金、水电费、移动电话用户、保险、儿童保健和学费。
当企业采用大数据作为其商业战略的一部分，第一个问题通常大数据会启动什么样的价值? 有助于高层或低层，或者会有一个非金融类驱动?
从一个价值点来看，对大数据分析应用程序可分为三个维度(见图 13)之一。
第一项也就是最明显的是营运效率。在这种情况下，数据是被用在做出更好的决策，以优化资源消耗，并提高过程的质量和性能，这是自动数据处理一直在提供的，不过也有一个增强的功能集。第二个维度是客户体验;
典型的目标是提高顾客的忠诚度，进行精确的顾客细分，优化客户服务。包括公共互联网庞大的数据资源，大数据推动 CRM
技术的下一个发展阶段，这也使新的商业模式，从现有产品的补充收入来源，并创建全新的(数据)产品的额外收入。
图13 价值维度的大数据用例
【编辑推荐】
【责任编辑： TEL：（010）】
大家都在看猜你喜欢
热点头条热点热点热点
24H热文一周话题本月最赞
讲师：52795人学习过
讲师：22896人学习过
讲师：134560人学习过
精选博文论坛热帖下载排行
本书深入浅出地说明了如何利用Java、Flash及XML进行Flash富媒体应用程序的开发。
本书知识丰富，内容结构合理，包括：Flash影片应用程序与...
订阅51CTO邮刊}

叫阿莫西中心