【注意】这是最近一次分享,报名后有机会获得后期所有内容
课程内容(2期):推荐系统与Flink流式计算
1.推荐系统的架构与核心技术
1)推荐为何成为APP的标配
2)推荐系统的技术架构
3)推荐系统的算法发展
4)如何快速构建基于互联网业务应用的推荐系统
2.浅析主流的推荐系统
1)谷歌经典的深度与宽度推荐模型
2)YouTube推荐系统算法
3)基于知识图谱的美团大脑
3.流计算难点之Flink 状态与容错
1)状态4种典型应用场景
2)状态管理需满足3点需求
3)Flink 状态分类与使用案例实现
4)Flink 状态保存与恢复案例实现
5)生产环境下如何选择状态的类型和存储方式
4.实时数仓之Flink 两个数据流Join的几种姿势
1)实时lookup数据库关联实现
2)预加载维表关联实现
3)维表变更日志关联实现
4)三种实现方式的性能对比与应用场景
课程内容(1期):数据中台与数仓架构
1.大数据架构师之技术栈及职业修养
1)大数据技术百花齐放的时代
2)大数据技术体系与主流技术栈
3)大数据行业职位划分&典型职业发展路径
4)如何规划自己的职业发展方向
2.离线数仓与实时数仓架构
1)数仓架构演变
2)数仓分层
3)Lambda架构
4)Kappa架构
5)实时数仓vs离线数仓
6)一线互联网实时数仓架构案例分析
3.开源数据中台架构
1)啥是中台、啥是数据中台
2)数据仓库 vs 数据平台 vs 数据中台
3)数据中台应该具备的能力
4)开源大数据技术中台架构
↓↓↓↓后期内容
• DBus大数据采集及汇聚专题:一个更能满足企业需求的大数据采集平台,功能远超Sqoop、DataX、Flume、Logatash、Filebeat等采集工具
• Atlas元数据管理专题:从Atlas扫盲到和Hive、HBase、Kafka、Flink等集成开发
• Ranger大数据安全专题:对比Kerberos、Sentry,玩转大厂常用的大数据安全方案Ranger
• DolphinScheduler工作流调度引擎专题:致力于解决数据处理流程中错综复杂的依赖关系,相比Azkaban、Oozie、Airflow更强大、更好用
• OLAP大数据分析引擎专题:Kylin和Druid哪个更好用?Kylin ON Druid如何集成开发才能更好满足企业业务需求?