HBase是一种构建在HDFS之上的分布式、面向列的存储系统。HBase在Hadoop之上提供了类似于Bigtable的能力,适用于实时读写、随机访问超大规模数据集。HBase不同于一般的关系数据库,它将大而稀疏的表放在服务器集群上,适合于非结构化数据存储的场景。 查看详情>
现在参加,众多学员与你并肩作战!
. . .
Kafka是由LinkedIn开发的一个分布式的消息系统,使用Scala编写,它以可水平扩展和高吞吐率而被广泛使用。目前越来越多的开源分布式处理系统如Cloudera、Apache Storm、Spark、Flink都支持与Kafka集成。 查看详情>
现在参加,众多学员与你并肩作战!
. . .
Ranger是HDP体系统中安全管理的重要一环。它提供了具体资源(如HBase中的具体表)权限管控、访问监控、数据加密的功能。 查看详情>
现在参加,众多学员与你并肩作战!
. . .
Apache Kylin(Extreme OLAP Engine for Big Data)是一个开源的分布式分析引擎,为Hadoop等大型分布式数据平台之上的超大规模数据集提供标准SQL查询及多维分析(OLAP)能力,并提供亚秒级的交互式分析功能。 查看详情>
现在参加,众多学员与你并肩作战!
. . .
Druid是MetaMarket公司研发的一款针对海量数据进行高性能实时分析的OLAP引擎(包含存储引擎和分析引擎)。 查看详情>
现在参加,众多学员与你并肩作战!
. . .
DBus(数据总线)项目为了统一数据采集需求而生, 专注于数据的收集及实时数据流计算,通过简单灵活的配置,以无侵入的方式对源端数据进行采集,采用高可用的流式计算框架,对公司各个IT系统在业务流程中产生的数据进行汇聚,经过转换处理后成为统一JSON的数据格式(UMS),提供给不同数据使用方订阅和消费,充当数仓平台、大数据分析平台、实时报表和实时营销等业务的数据源。支持多租户管理,提供租户级资源、数据隔离机制。 查看详情>
现在参加,众多学员与你并肩作战!
. . .
Apache DolphinScheduler是一个分布式去中心化,易扩展的可视化DAG工作流任务调度系统。致力于 解决数据处理流程中错综复杂的依赖关系,使调度系统在数据处理流程中开箱即用。 查看详情>
现在参加,众多学员与你并肩作战!
. . .
Apache Atlas是Hadoop社区为解决Hadoop生态系统的元数据治理问题而产生的开源项目,它为Hadoop集群提供了包括 数据分类、集中策略引擎、数据血缘、安全和生命周期管理在内的元数据治理核心能力。可以帮助企业构建其数据资产目录,对这些资产进行分类和管理,并为数据分析师和数据治理团队,提供围绕这些数据资产的协作功能。 查看详情>
现在参加,众多学员与你并肩作战!
. . .
Flume是Cloudera提供的一个高可用的、高可靠的、分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据。同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。 查看详情>
现在参加,众多学员与你并肩作战!
. . .
Davinci 是一个 DVaaS(Data Visualization as a Service)平台解决方案,面向业务人员/数据工程师/数据分析师/数据科学家,致力于提供一站式数据可视化解决方案。既可作为公有云/私有云独力部署使用,也可作为可视化插件集成到三方系统。用户只需在可视化 UI 上简单配置即可服务多种数据可视化应用,并支持高级交互/行业分析/模式探索/社交智能等可视化功能。 查看详情>
现在参加,众多学员与你并肩作战!
. . .
本项目采用Java语言实现,基于真实的爬虫项目进行改进和优化,希望进一步提升大家的大数据项目经验。本项目基本涵盖了爬虫项目的整个流程,包括数据爬虫、全文检索、数据可视化、爬虫项目监控、爬虫项目维护等等。解决了爬虫项目中遇到的棘手问题,包括破解网站反爬策略、网站模板定期变更、网站频繁访问IP被封等等问题。 查看详情>
本课程主要讲解在实际项目开发中,企业构建大数据平台的方案及实战。详细阐述企业级大数据平台的架构设计、机器选型、集群规划、技术选型、资源规划等技术方案。实战演练基于Cloudera Manager6(CDH6)安装部署、监控管理、运营维护大数据平台的各个服务组件。从理论经验到实战演练,从设计思想到流程实施,亲力亲测,你也很可以。还在想什么?赶紧来一探究竟吧! 查看详情>
现在参加,众多学员与你并肩作战!
. . .
Ambari是由 HortonWorks 开发的一个Hadoop相关的项目,这款软件具有集群自动化安装、中心化管理、集群监控、报警等功能,使得安装集群从几天的时间缩短在几小时以内,运维人员从数十人降低到几人以内,极大的提高集群管理的效率。还在想什么?赶紧来一探究竟吧!
推荐进阶课程:大数据实战精英+架构师班 查看详情>
现在参加,众多学员与你并肩作战!
. . .
0基础构建大数据平台 (hadoop+spark+flink)
本课程为0基础构建大数据平台 (hadoop+spark+flink),包含目前大数据常用的所有技术组件的环境部署。所有技术组件的安装部署,都是手把手操作,不会出现跳讲和断讲,0基础同学也能一站式搞定大数据平台环境(hadoop+spark+flink)。 查看详情>
现在参加,众多学员与你并肩作战!
. . .
为什么Hadoop需要工作流?工作流对Hadoop到底有哪些好处?Hadoop有哪些内置的工作流?Oozie和Azkaban到底有哪些区别?我该如何成功的安装并使用Azkaban?莫急!老师会亲手带着大家一步一步搞定,不仅要彻底明白为什么?还要保证大家也能轻松的使用起来。还在想什么?赶紧操练起来吧! 查看详情>
现在参加,众多学员与你并肩作战!
. . .
费劲!崩溃!丫的!搞了一周连个5节点集群(CDH5)都搭建不起来?我去,你的资料该换了!赶紧看看这个吧,零基础也很easy! 本课程老师将带着大家从虚拟机安装开始一步步实操演练,不仅教会你如何规划集群、如何规划目录、如何实现高可用(HA)等,还要让你明白每一步为什么要这么做?10小时视频,只为让你轻轻松松、明明白白成功搞定集群搭建。还在想什么?赶紧操练起来吧! 查看详情>
现在参加,众多学员与你并肩作战!
. . .
大数据VIP会员四大权益:① 30+大数据好课全部免费学,② 享受晚上21:30直播答疑,③ 享受全方位就业辅导和企业内推服务,④ 无时间限制,VIP课程存续期内永久免费学 查看详情>
现在参加,众多学员与你并肩作战!
. . .
基于Docker容器搭建Spark分布式集群,本课程一步步教大家如何部署docker,如何在docker部署spark,多台机器如何解决ip通信等一些真实的场景。 查看详情>
现在参加,众多学员与你并肩作战!
. . .