×
思维导图备注
Spark 编程指南简体中文版
首页
下载
阅读记录
书签管理
我的书签
添加书签
移除书签
RDD 持久化
浏览
820
扫码
分享
2020-01-09 16:19:28
RDD 持久化
RDD 持久化
Spark 有一个最重要的功能是在内存中
持久化
(或
缓存
)一个数据集。
上一篇:
下一篇:
Summary
快速上手
Introduction
Spark Shell
独立应用程序
编程指南
开始翻滚吧!
引入 Spark
初始化 Spark
Spark RDDs
并行集合
外部数据集
RDD 操作
使用键值对
传递函数到 Spark
Transformations
Actions
RDD持久化
共享变量
从这里开始
Spark Streaming
一个快速的例子
基本概念
关联
离散流
初始化StreamingContext
输入DStreams
DStream中的转换
缓存或持久化
DStream的输出操作
部署应用程序
Checkpointing
监控应用程序
配置Kinesis
flume集成指南
kafka集成指南
自定义receiver指南
减少批数据的执行时间
性能调优
内存调优
设置正确的批容量
容错语义
开始
Spark SQL
数据源
RDDs
JSON数据集
parquet文件
Hive表
其它SQL接口
编写语言集成(Language-Integrated)的相关查询
Spark SQL数据类型
调度(Scheduling)
与Apache Hive的兼容性
GraphX编程指南
属性图
图操作符
Pregel API
图构造者
顶点和边RDDs
图算法
例子
部署
独立运行Spark
Spark配置
在yarn上运行Spark
RDD 持久化
暂无相关搜索结果!
本文使用
EduBoo.COM
构建
×
分享,让知识传承更久远
×
文章二维码
手机扫一扫,轻松掌上读
×
文档下载
请下载您需要的格式的文档,随时随地,享受汲取知识的乐趣!
PDF
文档
EPUB
文档
MOBI
文档
×
书签列表
×
阅读记录
阅读进度:
0.00%
(
0/0
)
重置阅读进度