文章目录 1. 创建Maven项目 1.1 创建项目 1.2 添加项目依赖 1.3 修改源程序目录 1.4 添加Scala SDK 1.5 创建日志属性文件 2. 操作数据帧实战 2.1 创建数据文件 2.2 创建操作数据帧对象 2.3 运行程序,查看结果 3. 操作数据集实战 3.1 基于序列创建数据集 3.2 基于JSON创建数据集 3.3 数据集常见操作 3.3.1 API数据分析 3.3.2 类SQL数据分析 3.3.3 RDD算子分析 4. 数据帧与数据集的对比 5. SparkSQL执行流程概述 6. 实战小结 1. 创建Maven项目 1.1 创建项目 设置项目基本信息 单击【Create】按钮,生成项目基本骨架 1.2 添加项目依赖 在pom.xml文件里添加依赖 <?xml version="1.0" encoding="UTF-8"?> <