차원 모델링 뭘 고려해야할까
1)
차원 주제의 선택부터 하자
회사 조직의 부서 단위나 업무 영역별로 그리고
다양한 의사 결정 계층별로 다양한 분석요구를
수집 및 주제별 요구사항이 정리되어야 한다.
정리된 요구사항들은
주제별로 그룹화하여 분랴한다.
주제 중심으로 확장하여 차원주제들을 선택한다
2)
차원 특성의 도출
차원 주제와 관련한 다양한
분석 수준을 고려하여
차원 특성들을 도출한다.
차원 특성들이 수준별 분석이 가능하게
그룹화하고 특성 간의 개념 계층을 결정한다
3)
팩트 그룹의 결정
분석하려는 조직의 다양한 수치 등을
의미있게 그룹화함으로써
팩트그룹을 도출한다
측정값의 기본단위와 요약수준을 결정한다
4)
데이터 입도 결정 고려
분석 데이터의 구체화 정도를 의미하는 데이터 입도는
핵심 고려사항이다.
분석 데이터의 상세 수준정도를 결정하기 때문이다.
입도가 낮을수록 상세한 분석이 가능하나
반대로 저장 공간은 증가한다.
같은 데이터라도 다양한 수준의 분석 요구를
충족해야 하므로 하나의 데이터 값에 대한
여러 수준의 데이터 입도를 결정한다.
5)
저장 기간의 선택
데이터의 저장소 유지 기간을 결정해야한다.
일반적으로 데이터웨어하우스가 대용량의
저장소이지만 매일 입력되는 데이터의 양은 많은 편이다.
꾸준히 유입될 경우
데이터양이 급격히 증가하여 저장공간은
감당하기 어려울 수 있다.
적재되는 데이터들에 대해
요약 수준별, 주제별, 팩트 그룹별로
데이터의 저장기간을 미리 결정해야한다.
데이터의 저장소 유지기간은
데이터 분할과 같은 물리적 설계와 함께
고려해야 한다.
'데이터' 카테고리의 다른 글
DW, BI를 하다보면 듣게 되는 용어들 짤막한 이야기 (0) | 2023.12.12 |
---|---|
SSAS 큐브생성시 파티션 자동화 (0) | 2023.03.16 |
서브쿼리 주의하기 (0) | 2022.10.28 |
크로스 조인 (0) | 2022.10.28 |
데이터 정규화 간단 정리 (0) | 2022.10.26 |
댓글