加速Spark编译
时间:2022-07-22
本文章向大家介绍加速Spark编译,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。
今天看到 Spark 有一个挺好玩的 PR,打算本地合进来测试一下,那么这样就涉及到重新编译 Spark 的操作了。 看着本子已经挂着 Docker For Mac,打开 Kubernetes 已经吃掉了 8G 内存,还有若干 IDEA 打开着,我的本子一直呼呼在叫。 想起来以前在公司都是拿着测试服务器来做打包编译这些杂事的,所以到服务器上配置一下就好。 当然很多公司的服务器都是跟外网隔离的,但是幸运的是这些公司都会部署一个内网的 Maven 私有仓库,虽然有些公司自行开发内核,很多环境连 JDK 都没有,所以如果你需要跑 Spark 程序,你只需要 JRE 就够了,但是如果你需要在服务器上编译 Spark,那么你是需要 JDK 的。 不管怎么样,只要不限制上传文件,就可以把官网的 JDK 上传,安装好 Java 和 Maven,然后就可以搞起了。 最好的加速方法就是,有个专门的打包服务器,毕竟 Maven 是支持多线程构建的,而且测试服务器的资源,一般来说,都会比你本子多得多,如果有专用的拿来玩的服务器,那就更爽啦。
> mvn -T 8 -Pkubernetes -DskipTests clean package
-T 啥意思呢,看下面?
> mvn -h
...
-T,--threads <arg> Thread count, for instance 2. where C is core multiplied
....
当然了,Spark 官方也有提供一些 Maven 配置的 Tips,可以参考下。
SBT 的动态编译一直都很骚,有空再说说。
- 一些APT攻击案例分享
- 浅谈命令查询职责分离(CQRS)模式
- Numpy 修炼之道 (3)—— 数据类型
- 熔断器设计模式
- 树链剖分详解
- 洛谷P3379 【模板】最近公共祖先(LCA)(树链剖分)
- 学习使用Jieba1.Jieba2. 特点3.功能4.安装5.使用6.其他中文分词工具
- 如何使用sklearn加载和下载机器学习数据集
- 洛谷P3224 [HNOI2012]永无乡
- 手把手教你使用sklearn快速入门机器学习
- 【 关关的刷题日记48】Leetcode 58. Length of Last Word
- RESTful API 设计指南
- 洛谷P1043 数字游戏
- 使用“空”对象替代引用是否为空判断
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法
- iota: Golang 中优雅的常量
- Go template高级用法、深入详解、手册、指南、剖析
- Docker开启Remote API 访问 2375端口
- Docker实用debug调试技巧锦集
- shell 命名管道,进程间通信, ncat作http server
- Linux atop监控
- go modules中使用replace用法
- 分布式文件系统Ceph的挂载方式
- 在CentOS 7上挂载CephFS
- Qt音视频开发14-mpv读取和控制
- 深入理解Nginx的rewrite模块
- max os 安装各种问题/Error解决方法
- 不要启用 net.ipv4.tcp_tw_recycle
- 利用SSH(无密码)免登录来节省你的生命
- 深入linux下磁盘Disk,分区Partition,挂载Mount