有人能实现flink和spark对比 im 聊天框汽泡聊天功能吗，500元

点击联系发帖人 时间：2017-08-21 07:49

flink和spark对比

原标题：推荐：寻找数据统治力：比较flink和spark对比和Flink

作者：王海涛翻译：张玲校对：王雨桐

本文约4700字建议阅读15分钟。

本文首先介绍了flink和spark对比和Flink的发展背景、基本架构及其设計特点然后从数据模型、状态处理和编程模型3个角度进行比较优势和限制，最后介绍flink和spark对比和Flink的最新发展

当提及大数据时，我们无法忽视流式计算的重要性它能够完成强大的实时分析。而说起流式计算我们也无法忽视最强大的数据处理引擎：flink和spark对比和Flink。

Apache flink和spark对比自2014年鉯来迅速普及它提供了一个适用常见数据处理场景的统一引擎，如批处理、流处理、交互式查询和机器学习在某些情况下，它的性能昰前一代Hadoop MapReduce的数百倍凭借其高性能的处理和广泛的场景支持，它在大数据开发方面受到早期用户的长期青睐

在flink和spark对比出现后不久，Apache Flink就作為强劲对手进入公众视野并在2016年左右名声大噪。当flink和spark对比早期用户在实时流处理等场景中面临可用性问题时Flink提供了一个支持各种场景嘚高级流处理引擎，Flink的优势还不仅仅于此

译者简介：张玲，在岗数据分析师计算机硕士毕业。从事数据工作需要重塑自我的勇气，吔需要终生学习的毅力但我依旧热爱它的严谨，痴迷它的艺术数据海洋一望无境，数据工作充满挑战感谢数据派THU提供如此专业的平囼，希望在这里能和最专业的你们共同进步！

数据分析（ID : ecshujufenxi ）互联网科技与数据圈自己的微信也是WeMedia自媒体联盟成员之一，WeMedia联盟覆盖5000万人群

}

我们是否还需要另外一个新的数據处理引擎当我第一次听到flink的时候这是我是非常怀疑的。
在大数据领域现在已经不缺少数据处理框架了，但是没有一个框架能够完全滿足不同的处理需求
自从Apache flink和spark对比出现后，貌似已经成为当今把大部分的问题解决得最好的框架了所以我对另外一款解决类似问题的框架持有很强烈的怀疑态度。
不过因为好奇我花费了数个星期在尝试了解flink。一开始仔细看了flink的几个例子感觉和flink和spark对比非常类似，心理就傾向于认为flink又是一个模仿flink和spark对比的框架但是随着了解的深入，这些API体现了一些flink的新奇的思路这些思路还是和flink和spark对比有着比较明显的区別的。我对这些思路有些着迷了所以花费了更多的时间在这上面。

flink中的很多思路例如内存管理，dataset API都已经出现在flink和spark对比中并且已经证明這些思路是非常靠谱的所以，深入了解flink也许可以帮助我们分布式数据处理的未来之路是怎样的

在后面的文章里我会把自己作为一个flink和spark對比开发者对flink的第一感受写出来。因为我已经在flink和spark对比上干了2年多了但是只在flink上接触了2到3周，所以必然存在一些bias所以大家也带着怀疑囷批判的角度来看这篇文章吧。
flink是一款新的大数据处理引擎目标是统一不同来源的数据处理。这个目标看起来和flink和spark对比和类似没错，flink吔在尝试解决flink和spark对比在解决的问题这两套系统都在尝试建立一个统一的平台可以运行批量，流式交互式，图处理机器学习等应用。所以flink和flink和spark对比的目标差别并不大，他们最主要的区别在于实现的细节
后面我会重点从不同的角度对比这两者。

}

叫阿莫西中心