数据仓库的一般结构是如何的?

文 | Smartbi大数据百科 2021-04-22 阅读次数:3733 次浏览

商业智能BI产品更多介绍:https://www.smartbi.com.cn/

商业智能BI产品更多介绍:点击前往

    数据仓库结构体系-体系结构

    (1)数据源是数据仓库系统的基础,是整个系统的数据源泉,通常包含企业内部信息和外部信息。

    (2)数据的存储与管理是整个数据仓库系统的核心。数据仓库依照数据的覆盖范围能够分为企业级数据仓库和部门级数据仓库(通常称为数据集市) 。

    (3)OLAP (On Line Analytical Processing)server对分析须要的数据进行有效集成,按多维模型予以组织,以便进行多角度、多层次的分析,并发现趋势。

    (4)前端工具主要包含各种报表工具、查询工具、数据分析工具、数据挖掘工具以及各种基于数据仓库或数据集市的应用开发工具。

    数据仓库结构体系-事实表和维表

    事实表和维表是多维模型中的两个基本概念。

    事实表是数据分析所相应的主要数据项,通常是企业内的某项业务或某个事件。事实表中的事实一般具有数据特性和可加性,事实表中能够存储不同粒度的数据,同一主题中不同粒度的数据一般存储在不同的事实表中。

    维表中包括的通常是描写叙述性的文本信息,这些文本信息将成为事实表的检索条件。维表中的维属性应该详细明白,体现出维层次的划分,可以成为分析型查询的约束条件,这是数据仓库与操作型应用在数据模型设计上的一个不同点。维表层次的级别数量取决于查询 的粒度。在实际业务环境中,多维数据模型一般含有4~15维,很多其它的维数或更少的维数一般都非常少见。在详细工作中,设计人员一定要依据企业的实际情况确定对应的维。

    在多维模型中,事实表的主码是组合码,维表的主码是简单码,事实表中与维表主码相相应的各个组成部分是外码。事实表通过与各维相相应的外码值同维表联系在一起。查询时通过事实表和维表之间的这样的相应关系。


    数据仓库结构体系-数据组织结构

    星型模型     

    多维数据建模以直观的方式组织数据,并支持高性能的数据訪问。每个多维数据模型由多个多维数据模式表示,每个多维数据模式都是由一个事实表和一组维表组成的。多维模型最常见的是星形模式。在星形模式中,事实表居中,多个维表呈辐射状分布于其四周,并与事实表连接。

    位于星形中心的实体是指标实体,是用户最关心的基本实体和查询活动的中心,为数据仓库的查询活动提供定量数据。每一个指标实体代表一系列相关事实,完毕一项指定的功能。位于星形图星角上的实体是维度实体,其作用是限制用户的查询结果,将数据过滤使得 从指标实体查询返回较少的行,从而缩小訪问范围。每一个维表有自己的属性,维表和事实表通过keyword相关联。

     

    雪花模型

    雪花模型是对星型模型的扩展,每一个维度都可向外连接到多个具体类别表。在这样的

    模式中。维度表除了具有星型模型中的维度表功能外,还连接上对事实表

    进行具体描写叙述的洋细类别表。具体类别表通过对事实表在有关维上的具体描写叙述,达到了缩小事实表、提高查询效率的目的。

申请试用 了解更多

2024年度精选《思迈特制造行业BI最佳实践合集》

立即下载
Copyright© 广州思迈特软件有限公司  粤ICP备11104361号

电话咨询

售前咨询
400-878-3819 转1

售后咨询
400-878-3819 转2
服务时间:工作日9:00-18:00

微信咨询

添加企业微信 1V1专属服务