400 028 6601

建站动态

根据您的个性需求进行定制 先人一步 抢占小程序红利时代

IMF前期知识储备-WhatisSpark详细讲解(四大特性)-创新互联

Spark 官方网站使用如下简洁的语言描述了Spark

创新互联是一家专业的成都网站建设公司,我们专注网站建设、网站设计、网络营销、企业网站建设,友情链接一元广告为企业客户提供一站式建站解决方案,能带给客户新的互联网理念。从网站结构的规划UI设计到用户体验提高,创新互联力求做到尽善尽美。

IMF前期知识储备-What is Spark详细讲解(四大特性)我们可以从中提取出如下信息:

Spark是一个引擎

  1. 快速

  2. 通用

Spark可以用来处理数据

  1. 数据是大规模的

Spark本身并不提供数据存储能力,它只是一个计算框架

它的快速体现在什么地方呢?

IMF前期知识储备-What is Spark详细讲解(四大特性)如果处理的数据在内存中,运行MapReduce比hadoop要快100倍以上,要是数据在磁盘中,也比Hadoop快10倍以上。

为什么会快呢,Spark在处理数据的时候,使用了一个高级的执行引擎:DAG - 有向无环图 。以及内存计算。

易于使用:

可以使用scala、java、Python等语言快速的开发应用程序。Spark提供了超过80个操作来简单的构建并行应用。只需几行代码,就可以完成wordcount的计算。

IMF前期知识储备-What is Spark详细讲解(四大特性)

通用性:

Spark 提供了大数据一栈式解决方案。包含了流计算、图计算、机器学习、SQL等。

IMF前期知识储备-What is Spark详细讲解(四大特性)

对于开发、维护、学习成本都是大大的降低。

运行在任何地方:

Spark可以运行在Hadoop的YARN、Mesos, standalone,或者运行在云上。

Spark 处理的数据,可以存储在HDFS, Cassandra, HBase,和S3等等。

IMF前期知识储备-What is Spark详细讲解(四大特性)

Spark的发展非常快速,TimeLine如下

IMF前期知识储备-What is Spark详细讲解(四大特性)

Spark进入Apache后,发展非常迅速。版本发布比较频繁。

Spark的生态体系(BDAS,中文:伯克利分析栈)

BDAS生态体系图:

IMF前期知识储备-What is Spark详细讲解(四大特性)

MapReduce和Spark比较

IMF前期知识储备-What is Spark详细讲解(四大特性)

异同点:

  1. 基本原理上

2. 模型上

3. 容错性

另外有需要云服务器可以了解下创新互联scvps.cn,海内外云服务器15元起步,三天无理由+7*72小时售后在线,公司持有idc许可证,提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案,具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势,专为企业上云打造定制,能够满足用户丰富、多元化的应用场景需求。


分享标题:IMF前期知识储备-WhatisSpark详细讲解(四大特性)-创新互联
标题路径:http://mzwzsj.com/article/djohji.html

其他资讯

让你的专属顾问为你服务