首页 > 生活

数据仓库详解

更新时间:2025-05-16 06:37:59 阅读: 评论:0

谷歌3d地图

数据仓库详解这个主要分为4个模块:(1)基础知识准备,(2)数据域,(3)数仓分层,(4)表命名。下面我们来一一详细介绍。

基础知识准备

这部分都是一些数据的基本概念,我们罗列在正统道藏此:

数据域:指面向业务分析,将业务过程或者维度进行抽象的集合。如生产域、消费域、内容域等。业务过程上海百度推广:指业务活动事件,如域名邮箱下单、支付、退款等。维度/事实:维度是维度建模的向阳素描基础和灵魂。在维度建模中,将度量称为“事实”,将环境描述为“维度”,维度是用于分析事实所需要的多样环境。事实表:作为数据仓库维度建模的核心,紧紧围绕业务过程来设计,通过获取描述业务过程的度量来表达业务过程,包含了引用的维度和业务过程有关的度量。粒度(粗/细):弹丸礁事实表中一条记录所表达的业务细节成都被称为粒度。如短视频业务里,事实表中数据爱深过做人是天级总vv(粗粒度),单个用户vv(细粒度)温州炒房团。数据模型:数据组织和存储的方法,它强调从业务、数据存取和使用角度合理存火凤三国储数据。

数据域

以短视频业务为例,其数据域主要有以下几个部分:核心域,用户域,生产域,内容域,消费域ae吧等等,具体如下。

数最美女人据域

数仓分层

任何一个常见到的数仓分层,基本都是下面这样的,其中,我们重点阐述几个基本概念:

ADS,Application Data Service,数据应用层CDM,Commo电脑主页n Data Model,通用数据模型层公共维度层DIM(Data Warehouse Detail),如用周华健粤语歌户维表明细粒度事实层DWD((单身礼物Data Warehouse Detail),如h5活动明细表公共汇总粒度事实层DWS(Data Warehouse Summary),如视频消费表ODS,Oper口红哪个牌子好ation Data S战略力量tore,未经过处理的原始数据数仓分开网店赚钱吗层

表命名

规增加收入范的表命名,能让使用表的人一看就能明白这个表的加工、存储逻辑。比如,我们一看到表条石鲷末尾萨顶顶假唱是“_1d”,我们就知道这是一个天级增量的表;一看到表末尾是“_df”,我们就知道这是一个天级全量表。详细如下:

业务板块:app名称维度定义:视频维度(video)、用户维度(user)等统计时间周期时:最近1小时:1h,准实时:ts天:di天级增量,df天级全量,最近1天:1d,最近3天:3d,最近7天:1w,最近30天:1m,最近N天:nd周:自然周:cw,未来一周:f1w,自然月:cm,0点截至当前:tt,财年:fy表命名例子

本文发布于:2023-06-03 18:29:08,感谢您对本站的认可!

本文链接:http://www.ranqi119.com/ge/85/208595.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:详解   数据仓库
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 站长QQ:55-9-10-26|友情:优美诗词|电脑我帮您|扬州装修|369文学|学编程|软件玩家|水木编程|编程频道