本课程以FlinkSQL流批一体技术为主线,全面讲解Flink Table编程、SQL编程、Time与WaterMark、Window操作、函数使用、元数据管理,最后以一个完整的实战项目为例,详细讲解FlinkSQL的流式项目开发。学完本课程,希望零基础的学员能快速上手FlinkSQL进行项目开发,有基础的学员也能快速掌握FlinkSQL流批一体技术以及积累实战项目经验。 查看详情>
现在参加,众多学员与你并肩作战!
. . .
【严选】大数据从入门到入职 |Hadoop|Spark|Flink|数仓
这课虽然便宜,但真的很能打!除了不是直播外,其它方面不弱于6000元+的大数据线上就业课,也不弱于13800元+的线下大数据就业课! 查看详情>
现在参加,众多学员与你并肩作战!
. . .
本课程基于ClickHouse最新稳定版本进行讲解,着重讲解ClickHouse大数据技术理论与实战。课程全面包含ClickHouse核心理论、分布式集群部署、架构设计、数据实时查询、MergeTree表引擎底层设计、副本与分片读写原理、外部系统集成开发以及ClickHouse全流程大数据项目实战等内容,让大家从基础到实战快速掌握ClickHouse大数据分析技术。 查看详情>
HBase是一种构建在HDFS之上的分布式、面向列的存储系统。HBase在Hadoop之上提供了类似于Bigtable的能力,适用于实时读写、随机访问超大规模数据集。HBase不同于一般的关系数据库,它将大而稀疏的表放在服务器集群上,适合于非结构化数据存储的场景。 查看详情>
现在参加,众多学员与你并肩作战!
. . .
Kafka是由LinkedIn开发的一个分布式的消息系统,使用Scala编写,它以可水平扩展和高吞吐率而被广泛使用。目前越来越多的开源分布式处理系统如Cloudera、Apache Storm、Spark、Flink都支持与Kafka集成。 查看详情>
现在参加,众多学员与你并肩作战!
. . .
Ranger是HDP体系统中安全管理的重要一环。它提供了具体资源(如HBase中的具体表)权限管控、访问监控、数据加密的功能。 查看详情>
现在参加,众多学员与你并肩作战!
. . .
Apache Kylin(Extreme OLAP Engine for Big Data)是一个开源的分布式分析引擎,为Hadoop等大型分布式数据平台之上的超大规模数据集提供标准SQL查询及多维分析(OLAP)能力,并提供亚秒级的交互式分析功能。 查看详情>
现在参加,众多学员与你并肩作战!
. . .
Druid是MetaMarket公司研发的一款针对海量数据进行高性能实时分析的OLAP引擎(包含存储引擎和分析引擎)。 查看详情>
现在参加,众多学员与你并肩作战!
. . .
DBus(数据总线)项目为了统一数据采集需求而生, 专注于数据的收集及实时数据流计算,通过简单灵活的配置,以无侵入的方式对源端数据进行采集,采用高可用的流式计算框架,对公司各个IT系统在业务流程中产生的数据进行汇聚,经过转换处理后成为统一JSON的数据格式(UMS),提供给不同数据使用方订阅和消费,充当数仓平台、大数据分析平台、实时报表和实时营销等业务的数据源。支持多租户管理,提供租户级资源、数据隔离机制。 查看详情>
现在参加,众多学员与你并肩作战!
. . .
Apache DolphinScheduler是一个分布式去中心化,易扩展的可视化DAG工作流任务调度系统。致力于 解决数据处理流程中错综复杂的依赖关系,使调度系统在数据处理流程中开箱即用。 查看详情>
现在参加,众多学员与你并肩作战!
. . .
Apache Atlas是Hadoop社区为解决Hadoop生态系统的元数据治理问题而产生的开源项目,它为Hadoop集群提供了包括 数据分类、集中策略引擎、数据血缘、安全和生命周期管理在内的元数据治理核心能力。可以帮助企业构建其数据资产目录,对这些资产进行分类和管理,并为数据分析师和数据治理团队,提供围绕这些数据资产的协作功能。 查看详情>
现在参加,众多学员与你并肩作战!
. . .
本课程主要是构建大数据平台,包含目前大数据常用的所有技术组件的环境部署。所有技术组件的安装部署,都是手把手操作,不会出现跳讲和断讲,0基础同学也能一站式搞定大数据平台环境。 查看详情>
现在参加,众多学员与你并肩作战!
. . .
Flume是Cloudera提供的一个高可用的、高可靠的、分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据。同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。 查看详情>
现在参加,众多学员与你并肩作战!
. . .
Davinci 是一个 DVaaS(Data Visualization as a Service)平台解决方案,面向业务人员/数据工程师/数据分析师/数据科学家,致力于提供一站式数据可视化解决方案。既可作为公有云/私有云独力部署使用,也可作为可视化插件集成到三方系统。用户只需在可视化 UI 上简单配置即可服务多种数据可视化应用,并支持高级交互/行业分析/模式探索/社交智能等可视化功能。 查看详情>
现在参加,众多学员与你并肩作战!
. . .
在Pulsar出现之前,很多人喜欢使用MQ或者Kafka。在Pulsar出现之后,Pulsar结合了MQ和Kafka并做了很多优化,成为高性能、以扩展、多租户、跨地域复制的pub-sub 消息系统,其在雅虎平台的消息通知、邮件队列、日志管道都有很好的支持,雅虎有15000台服务器,每月浏览量有700亿,可见Pulsar的性能很客观,Pulsar在腾讯计费场景下也有很好的支持,Pulsar即将成为下一代消息处理系统。 查看详情>
现在参加,众多学员与你并肩作战!
. . .
本课程为Flink大数据项目实战教程,以Flink项目实现为主线,重点讲解Flink项目相关的核心技术,包含Flink流式计算、InfluxDB时序数据库和Grafana数据可视化等。本课程理论与实战相结合,最终全流程实现对YARN集群资源的画像。学完本课程,零基础的学员能快速上手Flink进行项目开发,有大数据基础的学员也能快速掌握Flink核心技术并积累Flink实际项目经验。 查看详情>
现在参加,众多学员与你并肩作战!
. . .
本课程为大数据金融信贷项目实战课,着重讲解企业中常用的大数据技术理论与实战,如Hadoop、Hive、HBase、Sqoop、Flume、Kafka、Spark Streaming、Spark SQL、Spark Structured Streaming等。课程包含离线项目和实时项目,从项目业务需求、技术选型、架构设计、集群安装部署、集成开发以及项目可视化进行多方位实战讲解。 查看详情>
干货多:15案例 + 3实战 + 2项目;
提升快:滴滴出行一线架构师传授实战经验,30小时多方位讲解数据仓库构建相关理论及实战内容
技术全:综合运用Hive/Flume/Kafka/Azkaban/Oozie/SparkSQL等技术; 查看详情>
现在参加,众多学员与你并肩作战!
. . .
基于知名手机厂商线上项目需求进行讲解,快速提升Spark项目经验,解决手机应用实时分析、实时查询。涵盖大数据实时计算一体化的处理流程,包括Flume,Kafka,spark-streaming和Hbase等。 查看详情>
现在参加,众多学员与你并肩作战!
. . .
本课程基于某电商公司运营实时分析系统(2B),对Flink进行系统讲解。通过本课程的学习,既能获得Flink企业级真实项目经验,也能深入掌握Flink的核心理论知识,还能获得Flink在生产环境中安装、部署、监控的宝贵经验,从而深入掌握Flink技术。 查看详情>
1个好项目不亚于1年工作经验!这是国内某顶级运营商线上运行的大数据项目,生产环境150+节点,学会后可以非常自信的写到简历上。课程内容涉及项目业务介绍、技术选型与架构设计、项目的架构演进、手机端到服务端数据流程、日志采集设计与要求、日志采集拓扑结构、线上和本地集群资源规划、项目全流程开发、项目总结,还有大数据项目面试可能被问到的21个问题。 查看详情>
本课程是由猎豹移动大数据架构师,根据Java在公司大数据开发中的实际应用,精心设计和打磨的大数据必备Java课程。通过本课程的学习大数据新手能够少走弯路,以较短的时间系统掌握大数据开发必备语言Java,为后续大数据课程的学习奠定了坚实的语言基础。 查看详情>
某大型电商平台为对用户进行分析、个性化运营及广告推送,通过设计标签指标体系、开发数据、ETL调度、监控预警、人群计算与分析等开发环节搭建起画像系统。借助该系统针对不同业务场景输出个性化运营用户群的解决方案。 查看详情>
现在参加,众多学员与你并肩作战!
. . .
基于知名视频网站电影推荐项目进行讲解,快速提升Spark 机器学习推荐项目经验。本课程从Spark离线推荐和实时推荐两个方面剖析电影推荐项目,使用技术包含 hadoop、hive、spark、kafka、zookeeper、hbase、phoenix、ZEPPELIN等 查看详情>
现在参加,众多学员与你并肩作战!
. . .
本课程为SpringBoot项目实战教程,以SpringBoot2.6核心技术为主线,理论与实战相结合,最终全流程实现新闻热搜数据大屏项目。学完本课程,零基础的学员能快速上手SpringBoot进行项目开发,有Java基础的学员也能快速掌握SpringBoot核心技术并完成数据大屏项目开发。 查看详情>
现在参加,众多学员与你并肩作战!
. . .
本课程重点构建ELK海量日志分析平台,包括Filebeat多数据源采集、打标记、多行异常信息整合,Logstash数据解析、过滤、清洗,ElasticSearch对数据进行存储、搜索以及分析,Kibana实现大数据分析和数据可视化。 查看详情>
本项目采用Java语言实现,基于真实的爬虫项目进行改进和优化,希望进一步提升大家的大数据项目经验。本项目基本涵盖了爬虫项目的整个流程,包括数据爬虫、全文检索、数据可视化、爬虫项目监控、爬虫项目维护等等。解决了爬虫项目中遇到的棘手问题,包括破解网站反爬策略、网站模板定期变更、网站频繁访问IP被封等等问题。 查看详情>
Scala语言具备面向对象和函数式两种编程范式,为程序设计带来了更大的灵活性和方便性。本课程系统讲解Scala的语言基础,通过对本课程的学习,大家将对函数式编程有初步的认识,也能够编写简单的Scala代码。 查看详情>
现在参加,众多学员与你并肩作战!
. . .
本课程主要讲解在实际项目开发中,企业构建大数据平台的方案及实战。详细阐述企业级大数据平台的架构设计、机器选型、集群规划、技术选型、资源规划等技术方案。实战演练基于Cloudera Manager6(CDH6)安装部署、监控管理、运营维护大数据平台的各个服务组件。从理论经验到实战演练,从设计思想到流程实施,亲力亲测,你也很可以。还在想什么?赶紧来一探究竟吧! 查看详情>
现在参加,众多学员与你并肩作战!
. . .
Ambari是由 HortonWorks 开发的一个Hadoop相关的项目,这款软件具有集群自动化安装、中心化管理、集群监控、报警等功能,使得安装集群从几天的时间缩短在几小时以内,运维人员从数十人降低到几人以内,极大的提高集群管理的效率。还在想什么?赶紧来一探究竟吧!
推荐进阶课程:大数据实战精英+架构师班 查看详情>
现在参加,众多学员与你并肩作战!
. . .
本课程为《大数据架构师精英班》的体验课,《大数据架构师精英班》课程的目标是帮助大数据老手成长为高手!课程包括大数据架构、实时数仓、数据中台、机器学习、个性化推荐等,讲师年薪200W+拒过美团蚂蚁金服offer 查看详情>
现在参加,众多学员与你并肩作战!
. . .
0基础构建大数据平台 (hadoop+spark+flink)
本课程为0基础构建大数据平台 (hadoop+spark+flink),包含目前大数据常用的所有技术组件的环境部署。所有技术组件的安装部署,都是手把手操作,不会出现跳讲和断讲,0基础同学也能一站式搞定大数据平台环境(hadoop+spark+flink)。 查看详情>
现在参加,众多学员与你并肩作战!
. . .
为什么Hadoop需要工作流?工作流对Hadoop到底有哪些好处?Hadoop有哪些内置的工作流?Oozie和Azkaban到底有哪些区别?我该如何成功的安装并使用Azkaban?莫急!老师会亲手带着大家一步一步搞定,不仅要彻底明白为什么?还要保证大家也能轻松的使用起来。还在想什么?赶紧操练起来吧! 查看详情>
现在参加,众多学员与你并肩作战!
. . .
费劲!崩溃!丫的!搞了一周连个5节点集群(CDH5)都搭建不起来?我去,你的资料该换了!赶紧看看这个吧,零基础也很easy! 本课程老师将带着大家从虚拟机安装开始一步步实操演练,不仅教会你如何规划集群、如何规划目录、如何实现高可用(HA)等,还要让你明白每一步为什么要这么做?10小时视频,只为让你轻轻松松、明明白白成功搞定集群搭建。还在想什么?赶紧操练起来吧! 查看详情>
现在参加,众多学员与你并肩作战!
. . .
大数据VIP会员四大权益:① 30+大数据好课全部免费学,② 享受晚上21:30直播答疑,③ 享受全方位就业辅导和企业内推服务,④ 无时间限制,VIP课程存续期内永久免费学 查看详情>
现在参加,众多学员与你并肩作战!
. . .
本课程基于最新的Spark 2讲解,使用目前最流行的Python语言进行开发,内容涵盖了企业中大数据处理的四大场景:离线批处理、流式计算、SQL处理、机器学习。 查看详情>
现在参加,众多学员与你并肩作战!
. . .
本项目基于联通用户话单进行讲解,快速提升Spark Sql项目经验。本项目通过近24课时的集中讲解,从项目需求分析到数据采集,然后通过Spark Sql完成业务统计,接着完成数据入库mysql,最后通过php结合echart完成数据可视化。 查看详情>
现在参加,众多学员与你并肩作战!
. . .
本项目基于爱奇艺用户行为项目进行讲解,快速提升Spark Streaming实时计算项目经验。本项目通过近35课时的集中讲解,从项目需求分析到数据采集,然后通过Spark Streaming完成业务统计,接着完成数据入库HBase,最后通过SpringBoot结合echart完成数据可视化。 查看详情>
现在参加,众多学员与你并肩作战!
. . .
Spark Streaming技术社区网站广告实时点击分析系统
基于社区广告用户实时点击项目进行讲解,偏重于Spark Streaming业务代码实现,解决恶意刷广告行为以及实现广告最优投放,提升Spark项目开发经验。 涵盖大数据实时计算一体化的处理流程,包括数据实时接入、数据实时处理以及数据实时可视化。 查看详情>
现在参加,众多学员与你并肩作战!
. . .
基于Docker容器搭建Spark分布式集群,本课程一步步教大家如何部署docker,如何在docker部署spark,多台机器如何解决ip通信等一些真实的场景。 查看详情>
现在参加,众多学员与你并肩作战!
. . .
IDEA是一款功能强悍、非常好用的Java开发工具,近几年编程开发人员对IDEA情有独钟。虽然IDEA功能很强大,但目前市面讲解的不细致、不系统,导致很多IDEA初学者要么无从下手,要么耗费太多时间。本套课程分知识点进行录制讲解,大家可以精准找到想学的模块,方便大部分同学的学习和使用。
购买IDEA课程免费提供IDEA激活码
查看详情>现在参加,众多学员与你并肩作战!
. . .
随着大数据技术的不断发展壮大, Hive不再是大数据技术生态圈中一个普通的工具,而是在大数据分析和大数据仓库中占据着几乎不可替代的重要作用,大数据分析中Hive和Hbase、Hive和Spark SQL、Hive和Impala的结合使用愈加紧密,大数据仓库中Hive在数据仓库建模模块的作用暂时无可替代。所以,深入学好Hive是入门大数据分析、大数据仓库不错的选择。 查看详情>
本课程为ElasticSearch6.6视频搜索项目实战课程,项目基于Java开发,通过视频搜索项目案例的方式讲解Elasticsearch分布式搜索引擎中的核心技术,学员学习本课程以后可以初级实现类似优酷视频搜索项目。 查看详情>
本课程基于猎豹互联网直播项目,对Storm进行系统的讲解。通过本课程的学习,既能获得Storm企业级真实项目经验,也能深入掌握Storm的核心理论知识,从而达到企业级项目开发水平。 查看详情>
本课程是由猎豹移动大数据架构师,根据公司大数据平台的运维情况,精心设计和打磨的大数据必备Linux课程。通过本课程的学习大数据新手能够少走弯路,快速掌握Linux常用命令及Shell编程,为后续大数据课程的学习奠定了坚实的基础。 查看详情>
本课程基于阿里巴巴 MySQL binlog 增量订阅&消费组件,对Canal进行系统的讲解。课程先介绍Canal在电商运行项目中的架构设计与解决方案,然后详细讲解Canal架构原理以及Canal HA工作机制,最后通过Canal单节点Server,Canal HA集群,Canal集成Kafka三个案例进行实操,从而快速、深入掌握阿里Canal技术,实现数据实时增量采集。 查看详情>