课程介绍
本课程基于ClickHouse最新稳定版本进行讲解,着重讲解ClickHouse大数据技术理论与实战。课程全面包含ClickHouse核心理论、分布式集群部署、架构设计、数据实时查询、MergeTree表引擎底层设计、副本与分片读写原理、外部系统集成开发以及ClickHouse全流程大数据项目实战等内容,让大家从基础到实战快速掌握ClickHouse大数据分析技术。
课程特色
1.3分理论、7分实战
2.立足ClickHouse,围绕ClickHouse生态进行讲解
3.弱化ppt,强调实战操作
4.注重课程的连贯性,与实际项目相结合
适用人群
1.对大数据感兴趣的学员
2.对OLAP、BI感兴趣的学员
3.想提升ClickHouse实战经验的学员
4.想系统学习ClickHouse实时分析技术的学员
技术版本
1.ClickHouse20.2
2.Centos7
3.Zookeeper3.5.6
讲师介绍
-
杨俊
大讲台大数据高级讲师 | 原某广电数据咨询公司大数据高级架构师
原某广电数据咨询公司大数据高级架构师 资深Java玩家,大数据技术狂热者。曾在北京某广电数据咨询公司担任大数据高级架构师,7年以上大数据实操经验, 经历过10个以上的重量级大数据项目。Hadoop源码级技术大咖,熟练使用Hadoop、Spark、Flink、Hive、HBase、Flume、Kafka、ElasticSearch等各大主流组件。谦虚亲和,崇尚实操至上的教学理念。受到学员一致好评。
免费视频这么多,为什么还要来大讲台?
智能化
学习任务智能推送
混合式
“图文+视频”混合式课件
答疑快
30分钟问答响应
实战多
3分理论7分实战
包学会
账号长期有效学会为止
课程大纲
ClickHouse概述 |
01大数据核心术语-OLTP 02大数据核心术语-数据仓库 03大数据核心术语-BI 04大数据核心术语-OLAP 05大数据核心术语-立方体 06ClickHouse介绍及特点 07ClickHouse前世今生 08ClickHouse应用场景 09谁在使用ClickHouse 10ClickHouse与其他技术高性能对比 |
ClickHouse单节点安装部署 |
11ClickHouse系统规划 12Linux系统环境要求 13ClickHouse多种安装方式 14ClickHouse下载安装文件 15Linux关闭防火墙 16Linux设置FQDN 17ClickHouse解压安装 18CLickHouse核心目录讲解 19ClickHouse额外配置文件讲解 20ClickHouse修改配置文件 21ClickHouse服务启动与关闭 22ClickHouse访问测试 23点击和访问数据下载 24ClickHouse创建数据库与表 25ClickHouse海量数据导入与优化 26ClickHouse数据实时查询 |
ClickHouse架构设计 |
27ClickHouse核心特性-MPP架构 28ClickHouse核心特性-完备的DBMS功能 29ClickHouse核心特性-列式存储 30ClickHouse核心特性-向量化执行引擎 31ClickHouse核心特性-支持SQL查询 32ClickHouse核心特性-支持多种表引擎 33ClickHouse核心特性-支持多线程和分布式 34CClickHouse核心特性-多主架构优势 35ClickHouse核心特性-支持实时查询 36ClickHouse核心特性-支持分布式查询 37ClickHouse架构设计与原理 38ClickHouse高性能秘诀-硬件才是硬道理 39ClickHouse高性能秘诀-算法是重中之重 40ClickHouse高性能秘诀-具体问题具体分析 |
ClickHouse数据分析查询实操 |
41ClickHouse创建数据库 42ClickHouse创建数据表 43数据下载与导入 44ClickHouse分析查询受欢迎城市 45ClickHouse分析查询爱旅行的城市 46ClickHouse分析查询到达目的地最多的出发城市 47ClickHouse分析查询周内各天航班延误率 48ClickHouse分析查询每年航班延误率 49ClickHouse分析查询各家航空公司航班延误率 50ClickHouse分析查询停止航班运营的航空公司 |
MergeTree底层原理分析 |
51MergeTree表引擎语法结构 52MergeTree数据物理存储结构 53MergeTree分区规则与命名规则 54MergeTree分区目录合并详细过程 55MergeTree稀松索引及生成规则 56MergeTree一级索引查询过程 57MergeTree二级索引 58MergeTree按列存储 59MergeTree压缩数据块 60MergeTree数据标记生成规则 61MergeTree数据标记工作方式 62MergeTree一级索引VS数据标记VS压缩数据块 63MergeTree数据写入过程 64MergeTree数据查询过程 |
多节点Linux系统与网络配置(补充) |
65-1VMware虚拟机安装 65-2Linux系统介绍 65-3Linux系统安装1 65-4Linux系统安装2 65-5Linux网络配置 65-6配置静态IP 65-7x-shell工具使用 65-8FileZilla工具使用 65-9修改Linux主机名 65-10配置主机名与IP映射 65-11关闭Linux防火墙 65-12创建用户和用户组 65-13配置ssh免密登录 65-14克隆并配置Linux虚拟机 65-15配置集群hosts 65-16部署时钟同步服务器 65-17集群ssh免密登录配置 65-18集群部署脚本使用 |
ClickHouse分布式集群安装部署 |
65ClickHouse集群依赖Zookeeper通信原理 66-1Zookeeper安装前规划(补充) 66-2JDK安装配置(补充) 66-3Zookeeper分布式集群构建(补充) 66ClickHouse集群节点实例准备 67ClickHouse集群文件配置 68ClickHouse集群服务启动 69ClickHouse访问Zookeeper |
ClickHouse副本与分片使用及读写原理 |
70ClickHouse副本与分片的逻辑和物理关系 71ClickHouse副本同步原理及实操 72分布式DDL实操及执行流程分析 73分布式表引擎实操 74分布式表引擎分片写入流程分析 75通过Distributed复制数据原理及实操 76通过ReplicatedMergeTree复制数据原理及实操 77分布式查询原理及实操 |
ClickHouse与Kafka集成开发 |
78-1Kafka概述 78-2系统架构 78-3Kafka拓扑结构 78-4Kafka集群配置 78-5Kafka集群服务启动与测试 78-6Kafka 新api数据发送与消费 78-7Kafka旧api数据发送与消费 78kafka表引擎介绍 79Kafka架构原理 80ClickHouse读Kafka数据流程 81ClickHouse写Kafka数据流程 82ClickHouse读Kafka案例实现 83ClickHouse写Kafka案例实现 |
ClickHouse与MySQL集成开发 |
84MySQL表引擎介绍 85MySQL安装与启动1 86MySQL安装与启动2 87ClickHouse读MySQL案例实现 |
Spark与ClickHouse集成开发 |
88-1Spark概述 88-2Spark Streaming概述 88-3Spark Streaming运行原理 88-4Spark Streaming 编程套路 88引入Spark和ClickHouse相关依赖 89Kafka+Spark+ClickHouse集成开发1 90Kafka+Spark+ClickHouse集成开发2 91ClickHouse集群启动及表创建 92Spark Streaming消费Kafka写入ClickHouse |