본문 바로가기
데이터

정보계 모델링 다차원 모델을 알아보자

by 웨더맨 2020. 7. 23.
반응형

정보계 모델링 다차원 모델을 알아보자

 

 

 

 

 

먼저 운영계와 정보계가 어떻게 다른지대략적이라도 알아보자
운영계는짧고 빠른 성격이다.다시말해 트랜잭션 위주의 데이터이다.
현재값 또는 최근 값들을 주로 보관하게된다.
업무단위별 구성으로 인해 많은 테이블들의 조인이 요구되어진다.
사용자가 여기있는 데이터를 가져와 사용하기엔 어렵다.

그렇다면 정보계는 
분석을 하기위한 공간이다.다양한 관점으로 분석을 한다.통합영역으로 주제영역별로 구성되어진다.사용자가 이해하기 용이한 구조이다.

 

 


다차원 모델이란
분석관점을 제공한다.코드성 데이터는 디멘젼 테이블로 구성된다.수치 데이터는 팩트 테이블로 정의한다.

다차원 모델의 종류에는스타 스키마 스노우플레이크 스키마 두종류가 있다.
그럼 이 두종류는 무엇으로 구분할가
스타스키마와 스노우플레이크 스키마의 차이점은디멘젼테이블의 정규화 또는 비정규화이다.

디멘젼 테이블의 키 구성모든 디멘젼 테이블은 한개의 PK칼럼을 가지게 된다.디멘젼 테이블의 PK는 연관된 팩트테이블의 FK가 된다.
디멘젼 테이블의 어트리뷰트 순서디멘젼 테이블 PK -> PK naming 칼럼 -> PK에 종속적인 칼럼마지막으로 ETL관리용 칼럼이 들어간다.

 

예) 데이터 적재일자 등


 

 

 

728x90
반응형

댓글