《Spark快速大数据分析》—— 第五章 数据读取和保存

时间:2022-04-22
本文章向大家介绍《Spark快速大数据分析》—— 第五章 数据读取和保存,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

由于Spark是在Hadoop家族之上发展出来的,因此底层为了兼容hadoop,支持了多种的数据格式。如S3、HDFS、Cassandra、HBase,有了这些数据的组织形式,数据的来源和存储都可以多样化~