您的位置：首页 > 技术中心 > 运维 >

apache spark是什么

时间：2019-06-11 13:47

Apache Spark是一个开源集群运算框架，最初是由加州大学柏克莱分校AMPLab所开发。相对于Hadoop的MapReduce会在运行完工作后将中介数据存放到磁盘中，Spark使用了存储器内运算技术，能在数据尚未写入硬盘时即在存储器内分析运算。

Spark在存储器内运行程序的运算速度能做到比Hadoop MapReduce的运算速度快上100倍，即便是运行程序于硬盘时，Spark也能快上10倍速度。Spark允许用户将数据加载至集群存储器，并多次对其进行查询，非常适合用于机器学习算法。

使用Spark需要搭配集群管理员和分布式存储系统。Spark支持独立模式（本地Spark集群）、Hadoop YARN或Apache Mesos的集群管理。

在分布式存储方面，Spark可以和HDFS、 Cassandra、OpenStack Swift和Amazon S3等接口搭载。 Spark也支持伪分布式（pseudo-distributed）本地模式，不过通常只用于开发或测试时以本机文件系统取代分布式存储系统。在这样的情况下，Spark仅在一台机器上使用每个CPU核心运行程序。

在2014年有超过465位贡献家投入Spark开发，让其成为Apache软件基金会以及大数据众多开源项目中最为活跃的项目。

更多Apache相关知识知识，请访问Apache使用教程栏目！

以上就是apache spark是什么的详细内容，更多请关注gxlcms其它相关文章！

相关推荐

电脑软件

热门排行

今日推荐

奇点小说安卓版

版本：v2.5

大小：35.75MB

日期：2025-02-01
点阅小说大全正版

版本：v1.5.8

大小：17.87MB

日期：2025-02-01
家育帮家长版

版本：v1.0.5

大小：21.92MB

日期：2025-02-01
云行天下官方版

版本：v1.0.1

大小：89.42MB

日期：2025-02-01
羞涩小说免费版

版本：v1.1.3

大小：44.29MB

日期：2025-02-01
飞悦免费小说正版

版本：v2.2

大小：12.23MB

日期：2025-02-01

热门手游

商场购物模拟器官方版

版本：v1.0.9

大小：46.11MB

日期：2024-12-16
滚动方块大冒险免费版

版本：v1.0.5

大小：26.10MB

日期：2024-12-16
恋恋奇缘体验服版

版本：v1.0.0

大小：131.33MB

日期：2024-12-16
炉石传说官方正版

版本：v1.0

大小：100.52MB

日期：2024-12-16
人群大师免费版

版本：v2.15.0

大小：57.68MB

日期：2024-12-16
方鸡跳跑单机版

版本：v1

大小：63.49MB

日期：2024-12-16