问答社区

原创作者: 图龙网络科技发布时间： 2023-09-23 236.64K 人阅读

Apache Spark – 用于大规模数据处理的统一分析引擎通用计算图的优化引擎

太极混元发布于 4个月前分类：语言模型

Spark是一个用于大规模数据处理的统一分析引擎。它提供 Scala、Java、Python 和 R 中的高级 API，以及支持用于数据分析的通用计算图的优化引擎。它还支持一组丰富的高级工具，包括用于 SQL 和 DataFrames 的 Spark SQL、用于 pandas 工作负载的 Spark SQL 上的 pandas API、用于机器学习的 MLlib、用于图形处理的 GraphX 以及用于流处理的 Structured Streaming。

在线文档

您可以在项目网页上找到最新的 Spark 文档，包括编程指南。此自述文件仅包含基本设置说明。

构建火花

Spark 是使用Apache Maven构建的。要构建 Spark 及其示例程序，请运行：

./build/mvn -DskipTests clean package

（如果您下载了预构建的软件包，则无需执行此操作。）

更详细的文档可从项目站点 “Building Spark”获取。

有关一般开发技巧，包括有关使用 IDE 开发 Spark 的信息，请参阅“有用的开发人员工具”。

交互式 Scala Shell

开始使用 Spark 的最简单方法是通过 Scala shell：

./bin/spark-shell

尝试以下命令，该命令应返回 1,000,000,000：

scala> spark.range(1000 * 1000 * 1000).count()

交互式 Python Shell

或者，如果您更喜欢 Python，则可以使用 Python shell：

./bin/pyspark

并运行以下命令，该命令还应返回 1,000,000,000：

>>> spark.range(1000 * 1000 * 1000).count()

示例程序

Spark 目录中还附带了几个示例程序examples。要运行其中之一，请使用./bin/run-example <class> [params].例如：

./bin/run-example SparkPi

将在本地运行 Pi 示例。

您可以在运行示例时设置 MASTER 环境变量以将示例提交到集群。这可以是spark:// URL、“yarn”（在 YARN 上运行）、“local”（用一个线程在本地运行）或“local[N]”（用 N 个线程在本地运行）。如果该类位于examples 包中，您还可以使用缩写的类名。例如：

MASTER=spark://host:7077 ./bin/run-example SparkPi

如果没有给出参数，许多示例程序都会打印用法帮助。

运行测试

首先测试需要构建 Spark。 Spark 构建完成后，可以使用以下命令运行测试：

./dev/run-tests

请参阅有关如何运行模块测试或单个测试的指南。

还有一个 Kubernetes 集成测试，请参阅resource-managers/kubernetes/integration-tests/README.md

关于 Hadoop 版本的说明

Spark 使用 Hadoop 核心库与 HDFS 和其他支持 Hadoop 的存储系统进行通信。由于协议在不同版本的 Hadoop 中发生了变化，因此您必须针对集群运行的同一版本构建 Spark。

请参阅 “指定 Hadoop 版本并启用 YARN”中的构建文档，了解有关构建特定 Hadoop 发行版的详细指南，包括构建特定 Hive 和 Hive Thriftserver 发行版。

配置

有关如何配置 Spark 的概述，请参阅在线文档中的配置指南。

0个回复

龙族们都在等待回复

提供中小企业建站高端正版精品系统

正品模板购买协议

签到

客服

工作时间

工作日：9:00 - 18:00
节假日：9:00 - 18:00

点击咨询客服

微信
扫一扫添加客服微信

智能

提问

登录

注册


or

or

忘记密码？

发布新帖
图龙网络科技工作室+官方网站微信
百姓声音

日本风情街在我国多城市开业引争议，网友怒批切勿盲目追求他国文化！

网信办要求取消明星艺人榜单“饭圈”治理升级！

疫苗接种尽早打，防范未然靠大家，凯里体育馆几乎天天座爆满

辛巴直播间狂飙：谁也不能把我打倒，我是英雄，不能被打成狗熊

绿色环境垃圾分类红领巾在行动

推动解决老年人智能技术困难
民族文化

拥有很好的技术素质也无法赚到钱，通常涉及到哪些方面的原因？

贵州黔东南旅游要塞第一苗族“村落鼻祖”郎德村，吸引着国内外游客！

贵州“守墓人”白天工地搬砖月薪3000块，晚上回来守着 567具棺材

贵州最美“灵儿公主”杨宛灵惊艳登场竞选“形象大使竞选”

雷山县三角田爬坡节，站得高看得远风光无限好

2021年贵州台江阳芳-鼓藏节游行又到了
餐饮美食

餐饮投资管理公司织梦企业模板自适应手机端（定制版）

餐饮加盟行业网站织梦模板带手机端站（定制版）

餐饮加盟烹饪餐饮小吃培训学校类网站织梦模板带手机移动端（定制版）

非“摆地摊“莫属，我的朋友圈里也蠢蠢欲动，大家纷纷商量卖什么好。

刷毛肚火锅配方

正宗-纸包鱼烤鱼开花祖传秘方
设计软件

官方正版CHATGPT智能语言创作系统+音乐+视频+AI搜索3.1.6至尊版

同城家政预约服务/理疗/美容美甲/推拿足浴技师派单小程序（优化版）

电线电缆厂家类网站pbootcms模板(自适应手机端)

Audio Jungle超级配乐库精选影视片头背景音乐第86辑
素材标签
Adobe After Effects (12) Adobe公司 (11) AE模板 (5) AI智能机器人 (18) AI智能语言 (16) AI智能语言模型 (18) AI智能语言系统 (17) CHATGPT智能 (16) Chatgpt智能语言助手 (4) CHATGPT智能语言大模型 (18) CHATGPT智能语言系统 (10) CHATGPT正版系统 (6) pbootcms (11) PbootCMS内核 (5) pbootcms模板 (10) YUNCMS (8) 个人博客 (4) 主题巴巴 (7) 云优模板 (6) 仪器设备 (3) 企业网站 (3) 企业营销 (5) 创意营销 (6) 博客主题 (4) 品牌营销 (7) 外卖小程序 (5) 媒体营销 (6) 家政服务 (5) 工商财税 (4) 广告传媒 (3) 广告营销 (4) 建站公司 (5) 手机软件 (4) 教育培训 (4) 新闻资讯 (4) 智慧同城小程序 (6) 智慧同城小程序源码 (5) 智慧城市 (4) 智慧小程序 (5) 机械设备 (5) 汽车租赁 (5) 热点营销 (4) 织梦模板 (8) 营销思维 (6) 装修设计 (3)

近期评论
太极混元发表在《格创校园跑腿微信小程序前后端源码v1.1.64+v1.1.73更新版》
太极混元发表在《格创校园跑腿微信小程序前后端源码v1.1.64+v1.1.73更新版》
太极混元发表在《官方正版CHATGPT智能语言创作系统+音乐+视频+AI搜索3.1.6至尊版》
太极混元发表在《智慧城市同城V4小程序V2.28独立开源版+小程序+全插件+VUE小程序开源前端》
太极混元发表在《官方正版CHATGPT智能付费创作系统+音乐+视频+AI搜索3.1.0至尊版》