课程介绍
Flume是Cloudera提供的一个高可用的、高可靠的、分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据。同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。
讲师介绍
-
杨俊
大讲台大数据高级讲师 | 原某广电数据咨询公司大数据高级架构师
原某广电数据咨询公司大数据高级架构师 资深Java玩家,大数据技术狂热者。曾在北京某广电数据咨询公司担任大数据高级架构师,7年以上大数据实操经验, 经历过10个以上的重量级大数据项目。Hadoop源码级技术大咖,熟练使用Hadoop、Spark、Flink、Hive、HBase、Flume、Kafka、ElasticSearch等各大主流组件。谦虚亲和,崇尚实操至上的教学理念。受到学员一致好评。
免费视频这么多,为什么还要来大讲台?
智能化
学习任务智能推送
混合式
“图文+视频”混合式课件
答疑快
30分钟问答响应
实战多
3分理论7分实战
包学会
账号长期有效学会为止
课程大纲
Flume常用Source、Channel与Sink |
3flume source-avrosource 4flume source-thriftsource 5flume source-netcat tcp source 6flume source-http source 7flume source-exec source 8flume source-spooling directory source 9flume source-taildir source 10flume channel 11flume sink-hdfssink 12flume sink-avro sink 13flume sink-kafkasink |
Flume拦截器实操 |
14flume拦截器介绍 15flume拦截器使用-timestamp 16flume拦截器使用-host 17flume拦截器使用-static 18flume拦截器使用-removeheader 19flume拦截器使用-UUID 20flume拦截器使用-searchandreplace 21flume拦截器使用-regexfilter 22flume拦截器使用-regexextractor |
Flume不同应用场景案例实操 |
23flume应用场景-多个agent之间通信 24flume应用场景-聚合flow 25flume应用场景-复制channel选择器 26flume应用场景-多路复用channel选择器 27flume应用场景-实现负载均衡 28flume应用场景-高可用故障切换 |
Flume项目实战(一) |
32flume实操-源码二次开发部署方式 33flume实操-自定义拦截器提取文件1 34flume实操-自定义拦截器提取文件-配置文件编写 35flume实操自定义拦截器提交文件-代码修改1 36flume实操-自定义拦截器提取文件-代码2 37flume实操-自定义拦截器提取文件-打包部署1 38flume实操自定义拦截器提取文件-bug调试 |
Flume项目实战(二) |
39flume实操-自定义拦截器对数据源打标记-思路讲解 40flume实操-自定义拦截器对数据源打标记-源码开发 41flume实操-自定义拦截器对数据源打标签-打包部署 42flume实操-自定义拦截器数据源打标签-bug调试 |
Flume项目实战(三) |
43flume实操-flume整合hbase-源码修改思路分析 44flume实操-flume整合hbase-源码修改准备工作 45flume实操-flume整合hbase-源码修改 46flume实操-flume整合hbase-打包部署 |
Flume项目实战(四) |
47flume实操-taildir source bug修复前测试 48flume实操-taildir source源码导入 49flume实操-taildir source 源码bug修复 50flume实操-taildir source源码打包部署 51flume实操-taildir source源码进一步分析 |