데이터22 Nested Loops, Hash 정리 옵티마이저가 어떤 알고리즘을 선택할지는 데이터 크기, 결합키의 분산이라는 요인에 의존한다. 1.Nested Loops 2.Hash 3.Sort Merge Nested Loops는 이름 그대로 중첩 반복을 사용하는 알고리즘이다. 특징 1. 대상테이블에서 레코드를 하나씩 반복해서 스캔한다. 이 테이블을 구동테이블(driving table) 또는 외부테이블이라고 부른다. 다른 테이블은 내부테이블 이라고 부른다. 2.. 구동테이블은 레코드 하나마다 내부 테이블의 레코드를 하나씩 스캔해서 결합조건에 맞으면 리턴한다. 3. 모든 레코드에 반복한다. Nested Loops의 실행시간은 레코드 수에 비례한다 첫번째 단계에서 레코드 수가 적으면 Hash, Sort Merge에 비해 메모리 소비가 적다 Nested Lo.. 2022. 10. 19. SQLD 도전 이야기 현재 직장을 다니고 있습니다 문득 정보처리기사 이후에 별다른 자격증이 없기에 SQLD을 도전하게 되었습니다 정확히 시작부터 3주 정도 준비한거 같습니다 퇴근후 2~3시간 정도 2주정도 준비하고 마지막 일주일은 4시간정도 한거 같습니다. 물론 주말엔 좀 더 공부할 수 있었습니다 몇몇 합격수기를 보니 SQLD같은 경우는 노랭이와 기출문제를 풀어두면 합격이 되겠다는 판단이 들었습니다. 회사에서 짬날때 기출문제를 눈으로 풀었고 노랭이를 2번정도 본거 같습니다. 모델링쪽은 노랭이 두번정도에 요약지를 보니 어느정도 점수를 나올거 같았고 SQL활용에 시간을 좀 더 투자를 했고 문제의도와 개념파악을 확실하게 하는거를 생각하고 풀었습니다 직장다니면서 공부량이 부족하다보니 턱걸이로 합격하게 되었습니다 어쩌면 운이 좋았을.. 2022. 10. 11. 정보계 모델링 다차원 모델을 알아보자 정보계 모델링 다차원 모델을 알아보자 먼저 운영계와 정보계가 어떻게 다른지대략적이라도 알아보자운영계는짧고 빠른 성격이다.다시말해 트랜잭션 위주의 데이터이다.현재값 또는 최근 값들을 주로 보관하게된다.업무단위별 구성으로 인해 많은 테이블들의 조인이 요구되어진다.사용자가 여기있는 데이터를 가져와 사용하기엔 어렵다.그렇다면 정보계는 분석을 하기위한 공간이다.다양한 관점으로 분석을 한다.통합영역으로 주제영역별로 구성되어진다.사용자가 이해하기 용이한 구조이다. 다차원 모델이란분석관점을 제공한다.코드성 데이터는 디멘젼 테이블로 구성된다.수치 데이터는 팩트 테이블로 정의한다.다차원 모델의 종류에는스타 스키마 스노우플레이크 스키마 두종류가 있다.그럼 이 두종류는 무엇으로 구분할가스타스키마와 스노우플레이크 스.. 2020. 7. 23. 데이터베이스 SQL 조인 데이터베이스 SQL 조인 관계형데이터베이스에서 관계를 실제로 SQL에서 구현하는 것이 조인입니다.만약 물리모델에 기본키나 외부키 등이잘 정의되어 있지않다면조인의 역할은 중요해질 수 밖에 없다. 조인을 잘 하기 위해서는먼저 조인 대상 테이블의 기본키나테이블간에 관계에 대해 파악이 미리 되어있어야 한다. 그외 업무 요건와 모델에 따른조인조건과 추출되어야 하는 결과집합의 수준(LEVEL)이다. 수준(LEVEL)이란 무엇일까결과집합의 수준은 어떤 테이블을기준으로 추출할 것인가를 말한다고보면 된다. A테이블과 B테이블을 조인해서 결과를추출하려고 할때A테이블을 기준으로 결과집합을 추출할 것인지B테이블을 기준으로 결과집합을 추출할 것인지를말하는 것이다.만약 A테이블이 기준이라면최종 결과는 A테이블의 로우.. 2020. 5. 31. 이전 1 2 3 4 5 6 다음