Spark学习进度2
时间:2021-01-12
本文章向大家介绍Spark学习进度2,主要包括Spark学习进度2使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。
入门
第一个应用的运行
-
进入 Spark 安装目录中
cd /export/servers/spark/
-
运行 Spark 示例任务
bin/spark-submit \ --class org.apache.spark.examples.SparkPi \ --master spark://node01:7077,node02:7077,node03:7077 \ --executor-memory 1G \ --total-executor-cores 2 \ /export/servers/spark/examples/jars/spark-examples_2.11-2.2.3.jar \ 100
-
运行结果
Pi is roughly 3.141550671141551
编写 Spark 程序
Spark shell
-
Spark shell 是 Spark 提供的一个基于 Scala 语言的交互式解释器, 类似于 Scala 提供的交互式解释器, Spark shell 也可以直接在 Shell 中编写代码执行
-
启动 Spark shell
-
进入到spark安装目录
spark-shell --master master
就可以提交Spark 任务 -
master配置
地址 解释 local[N]
使用 N 条 Worker 线程在本地运行 spark://host:port
在 Spark standalone 中运行, 指定 Spark 集群的 Master 地址, 端口默认为 7077 mesos://host:port
在 Apache Mesos 中运行, 指定 Mesos 的地址 yarn
在 Yarn 中运行, Yarn 的地址由环境变量 HADOOP_CONF_DIR
来指定 -
测试
- 创建文件
- 启动spark-shell
- 执行代码
-
-
Spark shell 的原理是把每一行 Scala 代码编译成类, 最终交由 Spark 执行
Spark-submit
- Spark submit 是一个命令, 用于提交 Scala 编写的基于 Spark 框架, 这种提交方式常用作于在集群中运行任务
读取 HDFS 上的文件
-
上传文件到hdfs
cd /export/data hdfs dfs -mkdir /dataset hdfs dfs -put wordcount.txt /dataset/
-
在Spark shell中访问hdfs
val sourceRdd = sc.textFile("hdfs://node01:8020/dataset/wordcount.txt") val flattenCountRdd = sourceRdd.flatMap(_.split(" ")).map((_, 1)) val aggCountRdd = flattenCountRdd.reduceByKey(_ + _) val result = aggCountRdd.collect
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法
- Spring自动扫描无法扫描jar包中bean的解决方法
- JS 组件系列之BootstrapTable的treegrid功能
- 详解Yii2 之 生成 URL 的方法
- Linux启动过程详细介绍
- JavaScript实现提交模式窗口后刷新父窗口数据的方法
- 详解Yii2.0使用AR联表查询实例
- ASP.NET Core异常和错误处理(8)
- Java中Socket设置连接超时的代码分享
- C++的类型转换详细介绍
- Android编程实现手机震动功能的方法
- iOS中UIActionSheet动态添加按钮
- 详解yii2使用多个数据库的案例
- ASP.NET Core静态文件使用教程(9)
- C语言文件操作中 fgets与fputs 函数详解
- 详解编译器编译原理