百道网
 您现在的位置:图书 > 数据资产管理核心技术与应用
数据资产管理核心技术与应用


数据资产管理核心技术与应用

作  者:张永清//赵伟//蒋彪//王函|

出 版 社:清华大学出版社

出版时间:2024年08月

定  价:89.00

I S B N :9787302666998

所属分类: 专业科技  >  计算机/网络  >  网络与数据通信    

购买这本书可以去

标  签:

[查看微博评论]

分享到:

TOP好评推荐   [展开]

TOP内容简介

本书深入探讨数据资产 管理的核心技术与应用,融 入作者在大数据领域多年的 丰富经验。本书为读者提供 一套可以落地的数据资产管 理框架,并详解两个基于该 框架进行数据资产管理的应 用案例,使读者能 好地了 解数据资产管理底层所涉及 的众多核心技术,让数据可 以发挥出 大的价值。本书 配套PPT课件、示例源代码 、作者微信群答疑服务。 全书共分10章,第1章主 要让读者认识数据资产,了 解数据资产相关的基础概念 ,以及数据资产的发展情况 。第2~8章主要介绍大数据 时代数据资产管理所涉及的 核心技术,内容包括元数据 的采集与存储、数据血缘、 数据质量、数据监控与告警 、数据服务、数据权限与安 全、数据资产管理架构等。 第9~10章主要从实战的角 度介绍数据资产管理技术的 应用实践,包括如何对元数 据进行管理以发挥出数据资 产的 大潜力,以及如何对 数据进行建模以挖掘出数据 中 大的价值。 本书适合数据资产管理 者、数据资产管理初学者、 数据应用开发工程师、数据 分析师、数据库管理员、架 构师、产品经理、技术经理 作为技术参考书,也适合高 等院校或高职高专数据资产 管理相关课程的教学参考书 。

TOP作者简介

张永清,从事功能测试、自动化测试、性能测试、Java软件开发、大数据开发、架构师等工作十多年,在自动化测试设计、性能测试设计、性能诊断、性能调优、分布式架构设计等方面积累了多年经验。参与过的系统涉及公安、互联网、移动互联网、大数据、人工智能等领域。先后任职于江苏飞搏软件、苏宁大数据研发中心、苏宁研究院、苏宁人工智能研发中心、紫金普惠研发中心、福特汽车工程研究有限公司,历任测试经理、技术经理、部门经理、 架构师等职位。重点关注大数据、图像处理、高性能分布式架构设计等领域。著有图书《软件性能测试、分析与调优实践之路(第2版)》《软件性能测试、分析与调优实践之路》《Robot Framework自动化测试框架核心指南》。

TOP目录

第1章 认识数据资产
1.1 数据资产的基本介绍
1.2 数据资产的分类
1.3 数据资产的价值评估
1.4 数据资产的质量
1.5 数据资产的存储
1.6 数据资产管理
1.7 数据资产管理的信息化建设
1.8 数据资产与人工智能
第2章 元数据的采集与存储
2.1 Hive中的元数据采集
2.1.1 基于Hive Meta DB的元数据采集
2.1.2 基于Hive Catalog的元数据采集
2.1.3 基于Spark Catalog的元数据采集
2.2 Delta Lake中的元数据采集
2.2.1 基于Delta Lake自身设计来采集元数据
2.2.2 基于Spark Catalog来采集元数据
2.3 MySQL中的元数据采集
2.4 Apache Hudi中的元数据采集
2.4.1 基于Spark Catalog采集元数据
2.4.2 Hudi Timeline Meta Server
2.4.3 基于Hive Meta DB采集元数据
2.5 Apache Iceberg中的元数据采集
2.5.1 Iceberg的元数据设计
2.5.2 Iceberg元数据的采集
2.6 元数据的存储模型设计
2.6.1 如何对元数据进行整合
2.6.2 元数据的存储模型设计
第3章 数据血缘
3.1 获取数据血缘的技术实现
3.1.1 如何从Hive中获取数据血缘
3.1.2 从Spark执行计划中获取数据血缘
3.1.3 从Spark SQL语句中获取数据血缘
3.1.4 从Flink中获取数据血缘
3.1.5 从数据任务的编排系统中获取数据血缘
3.2 数据血缘的存储模型与展示设计
第4章 数据质量的技术实现
4.1 质量数据采集的技术实现
4.1.1 定义数据采集的规则
4.1.2 定时Job的技术选型
4.2 如何处理采集到的质量数据
4.3 质量数据的存储模型设计
4.4 常见的开源数据质量管理平台
4.4.1 Apache Griffin
4.4.2 Qualitis
第5章 数据监控与告警
5.1 数据监控
5.1.1 数据监控的种类
5.1.2 监控数据的特点与存储方式
5.2 常见的数据监控目标
5.2.1 数据链路监控
5.2.2 数据任务监控
5.2.3 数据质量监控
5.2.4 数据服务监控
5.2.5 数据处理资源监控
5.3 Prometheus简介
5.4 Grafana简介
5.5 使用Grafana和Prometheus来实现数据监控与告警
5.5.1 数据链路的告警实现
5.5.2 数据任务的告警实现
5.5.3 数据质量的告警实现
5.5.4 数据服务的告警实现
5.5.5 数据处理资源的告警实现
第6章 数据服务
6.1 如何设计数据服务
6.1.1 数据源管理
6.1.2 数据服务的敏捷化和可配置化
6.1.3 数据服务文档的自动生成
6.1.4 数据服务的统一认证与鉴权
6.1.5 数据服务的监控与告警
6.2 数据服务的性能
6.3 数据服务的熔断与降级
第7章 数据权限与安全
7.1 常见的权限设计模式
7.1.1 基于角色的访问控制
7.1.2 基于属性的访问控制
7.1.3 基于对象的访问控制
7.2 数据权限
7.2.1 列权限控制
7.2.2 行权限控制
7.3 数据脱敏
7.4 数据安全
第8章 数据资产架构
8.1 数据资产的架构设计
8.1.1 数据获取层
8.1.2 数据处理层
8.1.3 数据存储层
8.1.4 数据管理层
8.1.5 数据分析层
8.1.6 数据服务层
8.2 常见的开源数据资产管理平台
8.2.1 Apache Atlas
8.2.2 Data Hub
8.2.3 OpenMetadata
第9章 元数据管理实践
9.1 如何理解元数据
9.1.1 为何需要元数据
9.1.2 如何让元数据产生 大价值
9.1.3 元数据分类及其好处
9.1.4 元数据管理
9.1.5 参与角色
9.2 元数据管理
9.2.1 元数据模型的组织关系
9.2.2 元数据的采集
9.2.3 业务域设计
9.2.4 业务术语设计
9.2.5 元数据标签设计
9.2.6 数据Owner
9.2.7 数据生命周期
9.2.8 元数据注册和发布
9.2.9 核心功能介绍
0章 数据建模实践
10.1 什么是数据建模
10.1.1 数据模型分类
10.1.2 数据建模方法
10.2 数据仓库建模架构
10.3 关系型数据建模
10.3.1 概念模型阶段
10.3.2 逻辑模型阶段
10.3.3 物理模型阶段
10.4 维度建模
10.4.1 基本概念
10.4.2 维度表设计
10.4.3 事实表分类
10.4.4 基于维度建模的数据分析实践
参考文献

TOP插图

TOP 其它信息

装  帧:平装

页  数:252

版  次:1

开  本:16开

加载页面用时:31.6124