SQLD(SQL Developer) 정리 - 1과목 데이터 모델링의 이해

츄르사려고 코딩하는집사입니다.

1과목

1. 발생시점에 따른 엔티티 분류

- 기본키 엔티티

- 중심 엔티티

- 행위 엔티티

2. 데이터모델링

- 정보시스템을 구축하기 위한 데이터 관점의 업무 분석 기법

- 현실세계의 데이터에 대해 약속된 표기법에 의해 표현하는 과정

- 데이터베이스를 구축하기 위한 분석 및 설계의 과정

3. 데이터 모델링 유의점

- 중복 최소화 : 여러 장소 데이터베이스에 같은 정보를 저장하지 않도록 하여 중복성 최소화

- 유연성 : 데이터의 정의를 데이터의 사용 프로세스와 분리하여 유연성을 높임

- 일관성 : 데이터간의 상호 연관관계를 명확하게 정의하여 일관성 있게 데이터 유지

4. 개념적 데이터 모델링

- 추상화 수준이 높고 업무 중심적이고 포괄적인 수준의 모델링 진행

- 전사적 데이터 모델링, EA 수립시 많이 이용

5. 논리적 데이터 모델링

- 시스템으로 구축하고자 하는 업무에 대해 Key, 속성, 관계 등을 정확하게 표현

- 재사용성이 높음

6. 물리적 데이터 모델링

- 실제로 데이터베이스에 이식할 수 있도록 성능, 저장 등 물리적인 성격을 고려하여 설계

7. 데이터베이스 스키마 구조 3단계

- 외부 스키마(External Schema)

- 개념 스키마(Conceptual Schema)

- 내부 스키마(Internal Schema)

8. 엔티티(Entity)

- 다른 엔티티와의 관계를 가짐

- 유일한 식별자에 의해 식별이 가능해야 함

- 업무 프로세스에 의해 이용되어야 함

- 반드시 속성을 포함해야 함

- 영속적으로 존재하는 인스턴스의 집합이어야 함

- 다른 엔티티와 최소 한 개 이상의 관계가 있어야 함

- 통계성 엔티티나 코드성 엔티티의 경우 관계를 생략할 수 있음

9. 기본 엔티티(키 엔티티)

- 다른 엔티티로부터 주식별자를 상속받지 않고 자신의 고유한 주식별자를 가지며 사원, 부서, 고객, 상품, 자재 등이 예가 될 수 있는 엔티티

10. 속성

- 엔티티, 인스턴스, 속성, 속성값의 관계

- 한 개의 엔티티는 두 개 이상의 인스턴스의 집합이어야 함

- 한개의 엔티티는 두 개 이상의 속성을 가짐

- 한개의 속성은 한 개의 속성값을 가짐

- 업무에서 필요로 하는 인스턴스에서 관리하고자 하는 의미상 더 이상 분리되지 않는 최소의 데이터 단위

11. 속성의 특성에 따른 분류

- 기본속성

- 설계속성

- 파생속성 : 예를 들어, 계산된 값을 의미함 (원금 X 이자율 = 이자)

12. 파생속성

- 데이터를 조회할 때 빠른 성능을 낼 수 있도록 하기 위해 원래 속성의 값을 계산하여 저장할 수 있도록 만든 속성

13. 도메인

- 각 속성은 가질 수 있는 값의 범위

- 엔티티 내에서 속성에 대한 데이터타입과 크기 그리고 제약사항을 지정하는 것

- 엔티티 내에서 속성에 대한 NOT NULL을 지정한다.

- 엔티티 내에서 속성에 대한 CHECK 조건을 지정한다.

14. 관계명

- 관계의 이름

15. 관계차수

- 1:1

- 1:M

- M:N

16. 관계선택사양

- 필수관계

- 선택관계

17. 데이터 모델링 순서

- 데이터모델링을 할 때 정규화 수행

- DB 용량산정

- 데이터베이스에 발생되는 트랜잭션 유형 파악

- 용량과 트랜잭션의 유형에 따라 반정규화 수행

- 이력모델의 조정, PK/FK 조정, 슈퍼타입 및 서브타입 조정 등을 수행

18. 1차 정규화 대상

- 중복속성에 대한 분리

- 로우단위의 중복

- 컬럼단위의 중복

19. 반정규화

- 정규화된 엔티티, 속성, 관계에 대해 시스템의 성능향상과 개발과 운영의 단순화를 위해 중복, 통합, 분리 등을 수행하는 데이터 모델링 기법

- 하나의 테이블의 전체 컬럼 중 자주 이용하는 집중화된 컬럼들이 있을 때 디스크 I/O를 줄이기 위해 해당 컬럼들을 별도로 모아놓는 반정규화 기법

20. RDMS는 현재 레코드를 기준으로 WINDOW FUNCTION으로 이전 또는 이후 위치의 레코드에 대한 접근이 가능함

21. 테이블의 반정규화 기법

1) 테이블 병합

- 1:1 관계 테이블 병합

- 1:M 관계 테이블 병합

- 슈퍼/서브타입 테이블 병합

2) 테이블 분할

- 수직분할

- 수평분할

3) 테이블 추가

- 중복테이블 추가

- 통계테이블 추가

- 이력테이블 추가

- 부분테이블 추가

22. 컬럼의 반정규화

- 중복컬럼 추가

- 파생컬럼 추가

- 이력테이블 컬럼추가

- PK에 의한 컬럼 추가

- 응용시스템 오작동을 위한 컬럼 추가

23. 파티셔닝

- 논리적으로 하나의 테이블이지만, 물리적으로는 여러 개의 테이블로 분리하여 데이터 액세스 성능도 향상시키고, 데이터 관리 방법도 개선할 수 있도록 테이블에 적용하는 기법

24. UNION과 UNION ALL

- UNION과 UNION ALL은 UNION할 대상들을 불러온 후, 다시 조합하여 보여주므로 성능이 저하된다.

https://yongku.tistory.com/entry/%EC%98%A4%EB%9D%BC%ED%81%B4Oracle-%EC%9C%A0%EB%8B%88%EC%98%A8UNION-UNION-ALL-%EC%82%AC%EC%9A%A9%EB%B2%95

오라클(Oracle) 유니온(UNION, UNION ALL) 사용법

츄르사려고 코딩하는집사입니다. 2개 이상의 SELECT 문의 결과가 있을 때, SELECT 문의 결과들을 1개로 합치고 싶으면 사용하는 연산자가 있습니다. 바로, 집합 연산자입니다. 집합 연산자는 UNION, UNI

yongku.tistory.com

25. 슈퍼/서브타입 데이터 모델

- 트랜잭션은 항상 전체를 통합하여 분석 처리하는데 슈퍼/서브타입이 하나의 테이블로 통합되어 있으면 하나의 테이블에 집적된 데이터만 읽어 처리할 수 있기 때문에 다른 형식에 비해 성능 우수

26. Global Single Instance(GSI)

- 통합된 한 개의 인스턴스

- 통합 데이터베이스 구조를 의미

27. ERD

- 1976년 피터첸에 의해 Entity-Relationship Model(E-R Model)이라는 표기법 만들어 짐

- ERD 작성 순서는 엔티티 도출 -> 엔티티 배치 -> 관계 설정 -> 관계명 기술의 흐름 작업 진행

- 관계의 명칭은 관계 표현에 있어서 매우 중요한 부분

28. ERD 작성 순서

1) 엔티티를 그린다.

2) 엔티티를 배치한다.

3) 엔티티간 관계를 설정한다.

4) 관계명을 기술한다.

5) 관계의 참여도를 기술한다.

6) 관계의 필수여부를 기술한다.

29. 엔티티 이름을 부여하는 방법

- 현업의 업무 용어를 사용하여 업무상의 의미를 분명하게 한다.

- 모든 엔티티에서 유일한 이름 부여

- 엔티티가 생성되는 의미대로 자연스럽게 부여

- 가능하면 약어를 사용하지 않는다.

- 단수명사를 사용한다.

30. 관계 표기법

- 관계명 : 관계의 이름

- 관계차수 : Cardinality 1:1, 1:M, 1:N

- 선택성 : 관계선택사양 Optionality 필수관계, 선택관계

31. 두 개의 엔티티 사이에 정의한 관계를 체크하는 사항

1) 두 개의 엔티티 사이에 관심 있는 연관규칙이 존재하는지

2) 두 개의 엔티티 사이에 정보의 조합이 발생하는지

3) 업무기술서, 장표에 관계연결을 가능하게 하는 동사가 있는지

4) 업무기술서, 장표에 관계연결에 대한 규칙이 서술되어 있는지

32. 주식별자 지정할 때 고려해야 할 사항

- 주식별자에 의해 엔티티 내의 모든 인스턴스들이 유일하게 구분되어야 함

- 주식별자를 구성하는 속성의 수는 유일성을 만족하는 최소의 수가 되어야 함

- 지정된 주식별자의 값은 자주 변하지 않는 것이어야 함

- 주식별자가 지정이 되면 반드시 값이 들어와야 함

33. 주식별자의 특징

1) 유일성

- 주식별자에 의해 엔티티내에 모든 인스턴스들을 유일하게 구분해야 함

2) 최소성

- 주식별자를 구성하는 속성의 수는 유일성을 만족하는 최소의 수가 되어야 함

3) 불변성

- 주식별자가 한 번 특정 엔티티에 지정되면 그 식별자의 값은 변하지 않아야 함

4) 존재성

- 주식별자가 지정되면 반드시 데이터 값이 존재(Null X)

34. 식별자관계 / 비식별자관계

항목	식별자관계	비식별자관계
목적	강한 연결관계 표현	약한 연결관계 표현
자식 주식별자 영향	자식 주식별자의 구성에 포함됨	자식 일반 속성에 포함됨
표기법	실선 표현	점선 표현
연결고려사항	반드시 부모엔티티 종속 자식 주식별자구성에 부모주식별자포함 필요 상속받은 주식별자속성을 타엔티티에 이전 필요	약한 종속관계 자식 주식별자구성을 독립적으로 구성 자식 주식별자구성에 부모주식별자 부분 필요 상속받은 주식별자속성을 타엔티티에 차단 필요 부모쪽의 관계참여가 선택관계

35. 성능데이터모델링

- 데이터베이스 성능 향상을 목적으로 설계단계의 데이터 모델링 때부터 성능과 관련된 사항이 데이터 모델링에 반영될 수 있도록 하는 것

- 데이터의 증가가 빠를수록 성능저하에 따른 성능개선비용 증가

- 데이터 모델은 성능을 튜닝하면서 변경이 될 수 있는 특징이 있음

- 분석/설계 단계에서 성능을 고려한 데이터모델링을 수행할 경우 성능 저하에 따른 Rework 비용을 최소화 할 수 있는 기회를 가짐

46. 성능 데이터 모델링 수행 절차

1) 데이터모델링을 할 때 정규화를 정확하게 수행

2) 데이터베이스 용량산정 수행

3) 데이터베이스에 발생되는 트랜잭션 유형 파악

4) 용량과 트랜잭션의 유형에 따라 반정규화 수행

5) 이력모델의 조정, PK/FK 조정, 슈퍼타입/서브타입 조정 등을 수행

6) 성능관점에서 데이터모델 검증

47. 정규화

정규화 절차	내용
제 1 정규화	속성의 원자성 확보 속성의 중복값 제거 기본키 설정
제 2 정규화	기본키가 2개 이상의 속성으로 이루어진 경우 부분 함수 종속성 제거 복합 인스턴스에 대해 각 인스턴스의 종속적 중복 삭제
제 3 정규화	기본키를 제외한 칼럼 간에 종속성 제거 이행 함수 종속성 제거
BCNF	기본키를 제외하고 후보키가 있는 경우 후보키가 기본키를 종속시키면 분해 후보키들이 복합 속성이어야 하며, 서로 중첩
제 4 정규화	다치 종속성 제거
제 5 정규화	조인에 의해 종속성이 발생되는 경우 분해

48. 반정규화

- 데이터베이스의 성능 향상을 위해 데이터 중복을 허용하고 조인을 줄이는 데이터베이스 성능 향상 방법

- 반정규화는 조회 속도를 향상시키지만, 데이터 모델의 유연성은 낮아짐

- 정규화된 엔티티, 속성, 관계에 대해 시스템의 성능향상과 개발과 운영의 단순화를 위해 중복, 통합, 분리 등을 수행하는 데이터 모델링 기법

- 데이터를 중복하여 성능을 향상시키기 위한 기법

- 성능을 향상시키기 위해 정규화된 데이터 모델에서 중복, 통합, 분리 등을 수행하는 모든 과정을 의미

- 데이터 무결성이 깨질 수 있는 위험이 있지만 데이터를 조회할 때 성능이 저하될 때 적용

49. 반정규화 고려

- 다량 데이터 탐색의 경우 인덱스가 아닌 파티션 및 데이터 클러스터링 등의 다양한 물리 저장 기법을 활용하여 성능 개선 유도

- 하나의 결과셋을 추출하기 위해 다량의 데이터를 탐색하는 처리가 반복적으로 빈번하게 발생하면 반정규화 고려

- 이전 또는 이후 위치의 레코드에 대한 탐색은 window function으로 접근 가능

- 집계 테이블 이외에도 다양한 유형에 대하여 반정규화 테이블 적용 필요할 수 있음

50. 반정규화 기법은 테이블, 속성, 관계에 대해 반정규화를 적용할 수 있으며, 하나의 테이블의 전체 칼럼 중 자주 이용하는 집중화된 칼럼들이 있을 때 해당 칼럼들을 별도로 모아 놓는 반 정규화 기법은 부분테이블 추가에 해당

51. 테이블의 반정규화

기법분류	반정규화 기법
테이블병합	1:1 관계 테이블병합
	1:M 관계 테이블병합
	슈퍼/서브타입 테이블병합
테이블분할	수직분할
	수평분할
테이블추가	중복테이블 추가
	통계테이블 추가
	이력테이블 추가
	부분테이블 추가

52. 칼럼의 반정규화

반정규화 기법

중복칼럼 추가

파생칼럼 추가

이력테이블 칼럼추가

PK에 의한 칼럼 추가

응용시스템 오작동을 위한 칼럼 추가

53. 한 테이블에 많은 칼럼들이 존재할 경우 데이터가 물리적으로 저장되는 디스크 상에 넓게 분포할 가능성이 커지게 되어 디스크 I/O가 대량을 발생할 수 있음. -> 성능 저하

54. 파티셔닝

- 논리적으로는 하나의 테이블이지만 물리적으로는 여러 개의 테이블로 분리하여 데이터 액세스 성능도 향상시키고, 데이터 관리방법도 개선할 수 있도록 테이블에 적용하는 기법

55. 분산 데이터베이스

1) 장점

- 지역 자치성, 점증적 시스템 용량 확장

- 신뢰성과 가용성

- 효용성과 융통성

- 빠른 응답 속도와 통신비용 절감

- 데이터의 가용성과 신뢰성 증가

- 시스템 규모의 적절한 조절

- 각 지역 사용자의 요구 수용 증대

- Global Single Instance(GSI)를 구성할 때 분산데이터베이스를 활용하여 구성하는 것이 효율적이다.

2) 단점

- 소프트웨어 개발 비용

- 오류의 잠재성 증대

- 처리 비용의 증대

- 설계, 관리의 복잡성과 비용

- 불규칙한 응답 속도

- 통제의 어려움

- 데이터 무결성에 대한 위협

56. 반정규화기법

- 중복칼럼 추가 : 조인감소를 위해 여러 테이블에 동일한 칼럼을 갖도록 한다.

- 파생칼럼 추가 : 조회 성능을 우수하게 하기 위해 미리 계산된 칼럼을 갖도록 한다.

- 이력테이블에 기능 칼럼 추가 : 최신값을 처리하는 이력의 특성을 고려하여 기능성 칼럼을 추가한다.

57. 속성의 특징

- 엔티티는 한 개의 속성만으로 구성될 수 없다.

- 엔티티를 설명하고 인스턴스의 구성요소가 된다.

58. PROCEDURE와 TRIGGER

- PROCEDURE와 TRIGGER 모두 CREATE 명령어로 생성한다.

- PROCEDURE는 COMMIT, ROLLBACK 명령어를 사용할 수 있다.

- TRIGGER는 COMMIT, ROLLBACK 명령어를 사용할 수 없다.

59. CONNECT_BY_ISLEAF

- LEAF면 1 아니면 0을 반환한다.

60. CUBE

- 결합 가능한 모든 값에 대하여 다차원 집계를 생성한다.

61.

저작자표시

'자격증 > SQLD' 카테고리의 다른 글

[SQLD] SQLD(SQL 개발자) 자격증 갱신하는 방법 (0)	2024.08.18
SQLD(SQL Developer) 정리 - 2과목 SQL 기본 및 활용 (0)	2021.11.15

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

SQLD(SQL Developer) 정리 - 1과목 데이터 모델링의 이해

츄르사려고 코딩하는집사입니다.

1과목

'자격증 > SQLD' 카테고리의 다른 글

공지사항

전체 카테고리

태그

블로그 인기글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역

츄르사려고 코딩하는집사입니다.

1과목

'자격증 > SQLD' 카테고리의 다른 글

공지사항

전체 카테고리

최근 글

최근댓글

태그

블로그 인기글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역