数据星河:构建现代化数据仓库之路 PDF

"详细讲解数据仓库建设中的各个环节 助力读者开启数据仓库的学习之旅"

作者:程志远、左岩、翟文麟

内容简介

"本书以数据仓库建设内容为主线,以理论基础为核心,引导读者渐进式地学习数据仓库建设版图中所需知识。通过认识数据基建、数据质量、数据安全、实时技术、数据治理、数据资产、数据服务、数据应用等8个模块及常见遇到项目,使读者能够了解日常数据仓库开发流程及数据仓库工作具体内容,从而快速上手数据仓库建设工作。

本书共14章,分为基础篇、基建篇、应用篇、评价篇、展望篇。基础篇(第1章和第2章)介绍数据仓库框架和数据模型建设知识点;基建篇(第3~8章)详细讲述数据仓库中每个板块建设,由简入深剖析搭建背景及搭建中细节;应用篇(第9~11章)通过实战讲解,快速上手数据仓库常见项目;评价篇(第12章和第13章)结合数据仓库基建和项目,阐述完整数据仓库需要具备的条件,并补充评价体系指标;展望篇(第14章)结合当前AIGC应用衍生出数据仓库未来发展探索;本书示例代码丰富,实际性和系统性较强,并配有视频讲解,助力读者透彻理解书中的重点、难点。

本书适合初学者入门,也适合工作多年数据仓库开发者借鉴学习,亦可作为高等院校和培训机构相关专业的教学参考书。

目录

CONTENTS

目录

本书源码

基础篇

第1章认识数据仓库00

1.1大数据在如今社会中的运用00

1.2大数据相关岗位介绍00

1.2.1数据仓库岗位介绍00

1.2.2数据平台岗位介绍00

1.2.3数据分析岗位介绍00

1.2.4数据产品岗位介绍00

1.2.5数据挖掘岗位介绍00

1.3大数据在企业中的组织架构00

1.3.1数据中台00

1.3.2业务线数据00

1.4数据仓库岗在大数据生态中的定位00

1.4.1数据仓库概念00

1.4.2数据仓库定位00

1.5数据仓库发展史00

1.5.1数仓1.0传统数据仓库时代00

1.5.2数仓2.0 Hadoop生态时代00

1.5.3数仓3.0云端及数据平台时代00

1.5.4数仓4.0湖仓一体时代00

1.6数据仓库建设内容简介00

1.6.1数据仓库建设版图0

1.6.2数据基建简介0

1.6.3数据资产简介0

1.6.4数据服务简介 0

1.6.5数据应用简介0

1.7数据仓库架构介绍0

1.7.1Lambda架构0

1.7.2HSAP架构0

1.7.3流批一体架构0

1.7.4Doris架构0

1.8数据仓库所使用的技术栈0

第2章数据仓库模型建设0

2.1OLTP与OLAP0

2.1.1什么是OLTP0

2.1.2什么是OLAP0

2.1.3OLTP与OLAP的区别0

2.2数据仓库分层0

2.2.1数据仓库分层原理0

2.2.2数据仓库分层内容0

2.3数据仓库模型介绍0

2.4数据仓库模型建设方法0

2.4.1三范式建模与维度建模介绍0

2.4.2三范式建模与维度建模区别0

2.5数据模型建设的具体流程0

2.5.1数据模型设计的基本原则0

2.5.2数据模型设计过程0

2.5.3数据模型建设五要素0

2.6数据域与主题域0

2.7事实表设计0

2.7.1事实表类型0

2.7.2三类事实表区别0

2.7.3全量和增量0

2.7.4拉链表0

2.7.5完整的数据模型内容案例0

2.8数据标准介绍0

2.8.1数据模型命名规范0

2.8.2数据模型命名词根0

2.8.3字段命名规范0

2.8.4字段类型规范0

2.8.5数据模型元数据规范0

2.8.6数据模型分区生命周期0

2.9数据模型发展周期0

2.10数据模型分层新式方法0

基建篇

第3章元数据0

3.1元数据定义及分类0

3.1.1元数据定义0

3.1.2元数据分类0

3.2元数据模型0

3.2.1确定元数据对象0

3.2.2确定元数据属性0

3.2.3确定元数据关系0

3.2.4创建元数据模型0

3.3元数据管理0

3.3.1元数据采集与收集0

3.3.2元数据存储0

3.3.3元数据维护0

3.3.4元数据使用0

3.4元数据管理工具0

3.5数据血缘0

3.5.1数据血缘功能0

3.5.2数据血缘类型0

第4章数据指标体系0

4.1数据指标概念0

4.2数据指标分类0

4.2.1按用途分类0

4.2.2按计算方法分类0

4.2.3按时间范围分类0

4.3数据指标设计0

4.3.1明确目标0

4.3.2选择方法0

4.3.3确保一致性0

4.3.4词根分类0

4.4数据指标的应用场景0

4.4.1数据明细报表0

4.4.2数据可视化图0

4.4.3数据挖掘0

4.4.4指标监控0

4.5数据指标中心建设0

4.5.1数据指标中心建设的目的0

4.5.2数据指标中心解决的痛点问题0

4.5.3数据指标中心建设流程0

第5章数据质量0

5.1数据质量背景0

5.1.1数据质量概念0

5.1.2数据质量存在的痛点问题0

5.2数据质量保障措施0

5.2.1制定数据模型及指标的上线变更规范0

5.2.2数据质量监控0

5.2.3数据基线及SLA0

5.2.4容灾备份快速恢复能力0

5.2.5数据问题上报平台0

5.2.6源头数据质量长期监测跟踪体系0

5.3推动上下游开展数据质量建设活动0

5.3.1数据仓库发展期0

5.3.2数据仓库成熟期0

5.4数据质量思考0

第6章数据安全0

6.1数据安全背景0

6.2数据安全实施难点0

6.2.1数据安全要做什么0

6.2.2数据安全现状梳理0

6.2.3数据安全保障方向0

6.3数据安全保障流程0

6.3.1角色权限管理0

6.3.2数据使用权限管理0

6.3.3数据模型分级0

6.3.4数据展示0

6.3.5数据风险预期管理0

6.3.6数据脱敏0

6.4数据安全实施阶段0

6.4.1早期数据安全实施0

6.4.2成熟期数据安全实施0

6.5数据安全思考0

第7章数据治理0

7.1数据治理背景0

7.1.1合规治理0

7.1.2资源治理0

7.2数据仓库发展阶段0

7.3数据治理内容0

7.3.1数据模型合规治理0

7.3.2数据质量合规治理0

7.3.3数据安全合规治理0

7.3.4存储资源治理0

7.3.5计算资源治理0

7.3.6小文件治理

7.4推动上下游开展数据治理活动方法

7.5数据治理思考与沉淀

第8章实时技术

8.1实时数据仓库搭建背景

8.2实时架构及组件

8.2.1实时数据仓库架构

8.2.2实时数据仓库组件

8.3实时开发流程

8.4实时链路优化

8.5实时技术产出量化

应用篇

第9章数据资产

9.1数据资产介绍

9.2风险名单数据资产(消费金融业务)

9.2.1项目背景

9.2.2项目流程介绍

9.2.3项目流程

9.2.4项目难点

9.2.5项目思考

9.3各场景下用户画像体系建设

9.3.1用户画像介绍

9.3.2项目背景

9.3.3项目流程介绍

9.3.4项目流程

9.3.5项目难点

9.3.6项目思考

第10章数据服务

10.1数据服务介绍

10.1.1数据服务概念

10.1.2当前数据应用时存在的痛点问题

10.2数据服务建设内容

10.2.1指标中心

10.2.2标签画像管理平台

10.2.3数据资产门户

10.2.4数据质量中心

10.2.5数据安全中心

10.2.6数据模型设计中心

10.2.7OneID

10.2.8数据治理360

10.3数据服务建设周期

10.3.1探索期

10.3.2扩张期

第11章数据应用

11.1数据应用介绍

11.2神策明星榜数据(视频行业业务)

11.2.1项目背景

11.2.2项目流程介绍

11.2.3项目流程

11.2.4项目难点

11.2.5项目思考

11.3员工离职动因专项分析(人力资源业务)

11.3.1项目背景

11.3.2业务视角分析

11.3.3项目流程

11.3.4项目思考

11.4征信系统专题分析

11.4.1项目背景

11.4.2项目流程

11.4.3项目产出

11.4.4项目思考

评价篇

第12章评价数据仓库的好坏

12.1数据质量层面评估

12.1.1数据质量问题产生的原因

12.1.2数据质量评估方法

12.2数据模型层面评估

12.2.1数据模型问题产生的原因

12.2.2数据模型评估方法

12.3数据安全层面评估

12.3.1数据安全问题产生的原因

12.3.2数据安全评估方法

12.4数据成本及性能层面评估

12.4.1数据成本过高及性能过低的原因

12.4.2数据成本及性能层面评估方法

第13章数据价值

13.1抽象的数据能力架构

13.1.1数据传输能力

13.1.2数据计算能力

13.1.3数据资产能力

13.1.4数据算法能力

13.2数据能力对数据价值的呈现

13.3数据价值对业务的帮助

13.3.1用户增长/经营性分析

13.3.2数据质量/产出稳定

13.3.3查数/用数提效

13.3.4降低部门支出

展望篇

第14章AIGC对数据发展的影响

14.1数据与AI的关系

14.2网易ChatBI介绍

14.3网易ChatBI功能

14.3.1需求理解能力

14.3.2提供用户所需内容的预测能力

14.3.3多轮对话能力

14.3.4图表绘制能力

14.3.5多端互通能力

14.3.6过程可验证能力

14.3.7用户可干预能力

14.4数据产品未来规划

14.4.1网易ChatBI产品未来规划

14.4.2其他数据产品未来规划

原创文章,作者:LifeTo.Fun,如若转载,请注明出处:https://www.lifeto.fun/archives/1759

Like (0)
Previous 1天前
Next 2025年3月22日

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注