图书说明:
使用此实用指南可成功处理设计企业数据湖时遇到的挑战,并了解解决问题的行业最佳实践。
在设计企业数据湖时,当您必须离开关系世界的舒适度并了解处理非关系数据的细微差别时,您经常遇到障碍。从将数据采购到Hadoop生态系统开始,您将经历可能带来诸如数据处理,数据查询和安全性等棘手问题的阶段。涵盖了变更数据捕获和数据流等概念。本书采用数据湖环境中的端到端解决方案,包括数据安全性,高可用性,数据处理,数据流等。
每章都包括概念的应用,代码片段和用例演示,为您提供实用的方法。您将学习概念,范围,应用和起点。
你将学到什么
- 了解数据湖架构和设计原则
- 实施数据捕获和流媒体策略
- 在Hadoop中实施数据处理策略
- 了解数据湖安全框架和可用性模型
本书适用于谁
大数据架构师和解决方案架构师