관계 데이터 모델의 개념

용어테이블 vs 릴레이션

릴레이션과 테이블의 차이는 추상적 개념과 이를 나타내는 구체적 표현의 차이인데 릴레이션은 추상적 개념(abstract concept)이고 테이블은 이 릴레이션을 기술하는 하나의 구체적 표현(concrete representation)인 것이다. 사실상 하나의 릴레이션은 여러 가지 형태의 테이블로 표현될 수 있는데 이와 같이 하나의 개념을 설명하는 표현 방법, 즉 구현 방법은 항상 여러 가지가 있을 수 있다. 테이블은 모든 애트리뷰트 값이 동일한 튜플을 하나 이상 가질 수 있다. 일반적으로 집합은 두 개의 동일한 원소를 허용하지 않기 때문에 테이블은 튜플 들의 집합이 아니고 튜플 들의 다중 집합이다. 즉 정리하면 릴레이션은 추상적 개념의 표현이며, 테이블은 이 릴레이션의 구체적인 표현이라 볼 수 있다.

  1. 관계 데이터 모델의 기본 개념
    • 속성(애트리뷰트, attribute, 열)
      각 속성은 서로 다른 이름을 이용해 구분한다.
    • 투플(tuple, 행)
      고객 한명에 대한 실제 속성 값 6개를 모아둔 것으로, 고객 개체의 인스턴스다.
    • 도메인
      속성 하나가 가질 수 있는 모든 값의 집합으로, 원자 값만 속성 값으로 사용할 수 있다. (ex. LANK의 도메인은 vip, gold, silver, bronze/ AGE의 도메인은 INT, NAME의 도메인은 CHAR(20))
    • 널 값
    • 차수(degree)
      하나의 릴레이션에서 속성의 전체 개수를 릴레이션의 차수라고 한다.(ex. Member 릴레이션은 차수가 6이다.)
    • 카디널리티
      투플의 전체 개수, (행의 갯수 == 데이터의 갯수)
  2. 릴레이션과 데이터베이스의 구성
    *고객 릴레이션 Member(ID, NAME, AGE, LANK, JOB, POINT)를 생각한다
    • 릴레이션 스키마(=릴레이션 내포, relation intension)
      릴레이션의 이름과 릴레이션에 포함된 모든 속성의 이름으로 정의하는 릴레이션의 논리적 구조( ex. MEMBER(ID, NAME, AGE, LANK, JOB, POINT) )
    • 릴레이션 인스턴스(=릴레이션 외연, relation extension)
      어느 한 시점에 릴레이션에 존재하는 투플의 집합
    • 데이터베이스 스키마와 데이터베이스 인스턴스
      일반적으로 DB는 릴레이션 여러 개로 구성된다. 즉, 데이터베이스 스키마는 릴레이션의 스키마를 모아둔 것이다.
  3. 릴레이션의 특성
    1. 투플의 유일성 : 하나의 릴레이션에는 동일한 투플이 존재할 수 없다.
      각 투플의 모든 원소를 비교해서 투플의 동일성을 검사하는 것은 비용이 많이 든다. 따라서 키(Key)를 선정해서 유일성을 보장한다.
    2. 투플의 무순서 : 하나의 릴레이션에서 투플 사이의 순서는 무의미하다.
      DB는 위치가 아닌 내용으로 검색되므로, 투플의 순서는 중요하지 않다.
    3. 속성의 무순서 : 하나의 릴레이션에서 속성 사이의 순서는 무의미하다.
      속성 값 역시 위치가 아닌 이름으로 접근하므로, 하나의 릴레이션에는 이름이 같은 속성이 존재할 수 없고, 이름도 속성의 의미가 명확히 드러나는 것으로 사용하는 것이 좋다.
    4. 속성의 원자성 : 속성 값으로 원자 값만 사용할 수 있다.
      모든 속성값은 다중 값을 가질 수 없다(ex. Member.JOB = (회사원, 학생) 은 불가능하다.)
  4. 키의 종류
    • 슈퍼키 : 유일성의 특성을 만족하는 속성 또는 속성들의 집합( ex. ID or (ID, NAME) or (NAME, ADDRESS) )
    • 후보키 : 유일성과 최소성을 만족하는 속성 또는 속성들의 집합( ex. ID or (NAME, ADDRESS) <- (ID, NAME)은 NAME이 없어도 되므로 최소성을 위반한다. )
    • 기본키 : 후보키들 중에서 기본적으로 사용할 키(필수 선택)
      • 널 값을 가질 수 있는 속성이 포함된 후보키는 기본키로 부적합하다
      • 값이 자주 변경될 수 있는 속성이 포함된 후비키는 기본키로 부적합하다
      • 단순한 후보키를 기본키로 선택한다
    • 대체키 : 기본키로 선택되지 못한 후보키들
    • 외래키 : 다른 릴레이션의 기본키를 그대로 참조하는 속성의 집합
  5. Member(ID, NAME, AGE, LANK, JOB, POINT, ADDRESS)를 고려하자

고객(고객아이디, 고객이름, 나이, 등급, 직업, 적립금), 주문(주문번호, 주문고객, 주문제품, 수량, 단가, 주문일자) 두개의 릴레이션에서 주문고객이 외래키 이다. 이때 외래키를 가진 릴레이션(주문 릴레이션)을 '참조하는 릴레이션'이라 하고, 기본키를 가진 릴레이션(고객 릴레이션)을 '참조되는 릴레이션'이라 한다.외래키 도메인과 기본키 도메인은 동일해야한다.외래키를 포함해서 기본키를 구성할 수도 있다.

외래키가 자기 자신을(본인 릴레이션)을 참조할 수도 있다.  
외래키는 NULL값을 가질 수 있다.  
외래키는 유일성이 보장되지 않는다.

관계 데이터 모델의 제약

무결성 제약조건(integrity constraint): 데이터에 결함이 없는 상태, 즉 데이터가 정확하고 유효하게 유지된 상태(사용자의 잘못된 요구에 의해 데이터가 부정확해지지 않도록 보호)

  1. 개체 무결성 제약조건: 기본키를 구성하는 모든 속성은 널 값을 가질 수 없다.
  2. 참조 무결성 제약조건: 외래키는 참조할 수 없는 값을 가질 수 없다.

'DB' 카테고리의 다른 글

데이터 모델링  (0) 2022.04.10
데이터베이스 시스템  (0) 2022.04.09
데이터베이스 관리 시스템  (0) 2022.04.09
데이터베이스 기본개념  (0) 2022.04.09

데이터 모델링과 데이터 모델의 개념

데이터 모델링(data modeling): 현실세계에 존재하는 데이터를 컴퓨터 세계의 데이터베이스로 옮기는 변환과정
추상화(abstraction): 현실세계의 특징을 잘 묘사하는 데이터를 뽑아내는 것

개념적 모델링(conceptual modeling): 묘사하고자 하는 대상에 대한 중요 데이터를 추출하여 개념 세계로 옮기는 작업
논리적 모델링(logical modeling): 개념 세계의 데이터를 데이터베이스에 저장할 구조를 결정하고 이 구조로 표현하는 작업
개념적 모델링 + 논리적 모델링 = 데이터 모델링

데이터 모델(data model): 데이터 구조+연산+제약조건

개체ㅡ관계 모델

개체-관계 모델 : 개체(entity)와 개체 간의 관계를 이용해 현실 세계를 개념적 구조로 표현하는 방법
개체-관계 다이어그램 : 현실 세계를 개체-관계모델을 이용해 개념적으로 모델링 하여 그림으로 표현한 것

  1. 개체
    개체(entity): 현실 세계에서 조직을 운영하는데 꼭 필요한 사람이나 사물같이 구별되는 모든 것

    개념적으로만 존재하는 사건이나 개념도 개체가 될 수 있다.
    개체 타입(entity type): 개체를 고유한 이름과 속성들로 정의한 것
    개체 인스턴스(entity instance), 개체 어커런스(entity occurrence): 속성이 실제 값을 가지므로서 실체화 된 개체
    개체 집합(entity set): 특정 개체 타입에 대한 개체 인스턴스들을 모아놓은 것

  2. 속성
    • 단일 값 속성과 다중 값 속성
      단일 값 속성: 인스턴스당 하나의 값만 있는 것(ex. 고객 이름, 고객 적립금)
      다중 값 속성: 인스턴스당 여러개의 값을 가지는 것(ex. 고객 전화번호, 책 저자)
    • 단순 속성과 복합 속성
      단순 속성: 더는 분해할 수 없는 속성(ex. 고객 아이디, 책 이름)
      복합 속성: 의미를 분해할 수 있어 값이 여러개의 의미를 포함하는 것(ex. 주소, 생년월일)
    • 유도 속성
      저장 속성: 값이 실제로 저장되어 있는 속성(ex. 가격, 할인율)
      유도 속성: 값이 별도로 저장되는 것이 아니라 기존의 다른 속성 값에 유도되어 결정되는 속성( ex. 판매가격 = (가격*(1-할인율)) )
    • 널 속성
      널 값: 아직 결정되지 않았거나 모르는 값, 존재하지 않는 값
      널 속성: 널 값이 허용되는 속성
    • 키속성
      키 속성: 개체 집합에 존재하는 각 개체 인스턴스들을 식별하는 데 사용

      키를 둘 이상의 속성들로 구성하기도 함

  3. 관계

관계 타입(relationship type): 개체와 개체 사이에 정의된 구매 관계(관계 타입도 속성을 가질 수 있다.) (ex. 고객(개체)과 책(개체) 사이에 구매(관계 타입) 정의, 구매의 속성으로 구매일자(속성), 결제방식(속성)을 가진다)
관계 인스턴스: 관계타입이 실제 값을 가지므로서 실체화 된 관계
- 관계의 유형
관계 참여하는 개체 타입의 수에 따른 분류: 이항 관계(개체 타입 2개가 맺는 관계), 삼항 관계(개체 타입 3개가 맺는 관계), 순환 관계(개체 타입 1개가 자기 자신과 맺는 관계)
매핑 원소의 수, 즉 매핑 카디널리티(mapping cardinality) 기준으로 분류 : 일대일, 일대다, 다대다
- 일대일 관계
- 일대다 관계
- 다대다 관계
- 관계의 참여 특성
A와 B의 관계를 생각한다
A의 모든 개체 인스턴스가 관계에 반드시 참여해야 하는 상황 : 'A가 관계에 필수적(or 전체) 참여한다'
A의 개체 인스턴스 중 일부만 관계에 참여해도 되는 상황: 'A가 관계에 선택적(or 부분) 참여한다'
- 관계의 종속성
A와 B의 관계를 생각한다
개체 B가 독자적으로는 존재할 수 없고, 다른 개체 A의 존재 여부에 의존적인 상황: '개체 B가 개체 A에 종속되어 있다' -> A가 존재해야 개체 B가 존재할 수 있고, A가 삭제되면 B도 삭제한다(생명주기가 A에 종속적이다) 이때 A를 강한 개체, B를 약한 개체fk gksek.
4. E-R 다이어그램

논리적 데이터 모델

  1. 논리적 데이터 모델의 개념과 특성
    앞서 설명한 개념적 데이터모델(개체-관계 모델)은 사람들의 머리속에 그려지는 개념적 모델임
    하지만, 이를 논리적 데이터 모델링을 하기 위해서 DBMS의 종류가 중요함
  2. 계층 데이터 모델
  3. 네트워크 데이터 모델

'DB' 카테고리의 다른 글

관계 데이터 모델  (0) 2022.04.10
데이터베이스 시스템  (0) 2022.04.09
데이터베이스 관리 시스템  (0) 2022.04.09
데이터베이스 기본개념  (0) 2022.04.09

데이터베이스 시스템의 정의

데이터베이스 시스템(DBS: DataBase System) : 데이터베이스에 데이터를 저장하고, 저장된 데이터를 관리하여 조직에 필요한 정보를 생성해주는 시스템

데이터베이스 VS 데이터베이스 관리 시스템 VS 데이터베이스 시스템

  • 데이터베이스 : 데이터를 저장해두는곳
  • 데이터베이스 관리 시스템 : 데이터베이스에 저장된 데이터가 일관되고 무결한 상태로 유지되도록 관리하는 시스템
  • 데이터베이스 시스템 : 데이터베이스와 데이터베이스 관리 시스템을 이용해 조직에 필요한 정보를 제공해주는 전체 시스템

데이터베이스 시스템은 데이터베이스, 데이터베이스 관리 시스템, 데이터베이스 사용자, 데이터언어로 이루어져있다.
아래에서 이 4가지 요소를 하나씩 알아보자

데이터베이스의 구조

  1. 스키마
    스키마(schema) : 데이터베이스에 저장되는 데이터 구조와 제약조건을 정의한 것(한번 정의되면 잘 바뀌지 않음)
    인스턴스(instance) : 정의된 스키마에 따라 데이터베이스에 실제로 저장된 값(자주 변경됨)
  2. 3단계 데이터베이스 구조
  • 3단계 데이터베이스 구조의 개념
  • 외부 단계(개별 사용자 관점)
    개별 사용자가 필요한 데이터들만을 바라보는 형태.로그인 담당자는 아이디, 비밀번호, 이름, 나이, 성별, 가입날자만 봄
    주문 담당자는 물품명, 회원아이디, 주문날자, 가격, 도착날자만 봄(여러 테이블을 조인해서)
    외부스키마 : 각 사용자가 생각하는 데이터베이스의 모습을 표현한 논리적인 구조로, 사용자마다 다르다.
  • 개념 단계(조직 전체 관점)
    데이터베이스를 조직 전체의 관점에서 이해하고 표현한다.개념 스키마는 조직 전체의 관점에서 생각하는 데이터베이스의 모습이며, 모든 개별 사용자가 생각하는 데이터베이스의 모습을 하나로 합친 형태다.
    개념스키마: 모든 사용자에게 필요한 데이터를 통합하여 전체 데이터베이스의 논리적 구조를 정의한다.(일반적으로 스키마라고 하면 개념스키마를 의미)
  • 내부 단계(물리적인 저장 장치의 관점)
    저장장치의 관점에서 이해하고 표현한다.
    내부스키마: 전체 데이터베이스가 저장 장치에 실제로 저장되는 방법을 정의한다.
  1. 데이터 독립성
    데이터베이스 구조의 각 단계는 하위단계에 맵핑(사상)된다. 따라서 하위 스키마를 변경하더라도 상위 스키마가 영향을 받지 않게 된다. 이는 곧 데이터 독립성으로 이어진다.
  • 논리적 데이터 독립성
    개념 스키마가 변경되더라도 외부 스키마가 영향을 받지 않는 것(외부/개념 사상 정보만 적절히 수정해주면 된다.)
  • 물리적 데이터 독립성
    내부 스키마가 변경되더라도 개념 스키마가 영향을 받지 않는 것(개념/내부 사상 정보만 적절히 수정해주면 된다.)
  1. 데이터 사전
    데이터베이스를 사용하려면 데이터 이외에 부가정보(스키마/사상정보 등)도 저장해야한다. 이러한 부가정보를 저장하는 곳이 데이터 사전/시스템 카탈로그라고 한다.

데이터베이스 사용자

  1. 데이터베이스 관리자
    데이터베이스 시스템을 운영-관리 한다. 데이터베이스 설계, 구축, 제어주요 업무
    • 데이터베이스 구성 요소 선정
    • 데이터베이스 스키마 정의
    • 물리적 저장 구조와 접근 방법 결정
    • 무결성 유지를 위한 제약조건 정의
    • 보안 및 접근 권한 정책 결정
    • 백업 및 회복 기법 정의
    • 시스템 데이터베이스 관리
    • 데이터베이스 재구성
  2. 최종사용자
    데이터를 조작(CRUD)하기 위해 데이터베이스에 접근하는 사람들
    • 캐주얼 사용자 : DB에 대한 이론적 지식이 있으며, 데이터 조작어를 이용함
    • 초보 사용자 : DB초보수준으로, GUI를 활용
  3. 응용프로그래머
    응용프로그램을 작성할 때 데이터 조작어를 삽입하는 사용자.

데이터 언어

  1. 데이터 정의어(DDL) : 스키마를 정의하거나, 수정 또는 삭제하기 위해서 사용한다.
  2. 데이터 조작어(DML) : 데이터의 삽입-삭제-수정-검색 등의 처리를 요구하기 위해서 사용한다.
    • 절차적 데이터 조작어 : 사용자가 어떤 데이터를 원하고 해당 데이터를 얻으려면 어떻게 처리해야 하는지를 구체적으로 설명
    • 비절차적 데이터 조작어 : 어떤 데이터를 원하는지만 설명 즉, 해당 데이터를 얻으려면 어떻게 처리해야 하는지는 데이터베이스 관리 시스템에 맡김
  3. 데이터 제어어(DCL) : 내부적으로 필요한 규칙이나 기법을 정의하기 위해서 사용한다.
    데이터 제어어를 이용해 규칙이나 기법을 정의하는 이유는 다음과 같은 특성을 보장하기 위함
    • 무결성
    • 보안
    • 회복
    • 동시성

데이터베이스 관리 시스템의 구성

  1. 질의 처리기 : 사용자의 데이터 처리 요구를 해석하여 처리하는 역할
    • DDL 컴파일러 : 데이터 정의어로 작성된 스키마의 정의를 해석한다. 그리고 저장 데이터 관리자를 통해 DB구축, 스키마를 데이터 사전에 저장함.
    • DML 프리 컴파일러 : 응용 프로그램에 삽입된 데이터 조작어를 추출하여 DML 컴파일러에 전달
    • DML 컴파일러 : 데이터 조작어로 작성된 데이터의 처리 요구를 분석하여 런타임 데이터베이스처리기가 이애할 수 있도록 해석한다.
    • 런타임 데이터베이스 처리기 : 저장 데이터 관리자를 통해 DB에 접근하여 DML 컴파일러로 부터 전달받은 데이터 처리 요구를 실행한다.
    • 트랜잭션 관리자 : DB에 접근하는 사용자 권한이 유효하고, 제약조건 위반여부를 확인하며, 회복이나 병행 수행과 관련된 작업도 수행한다.
  2. 저장 데이터 관리자
    내부단계(물리적 저장위치)에 접근하는 역할

'DB' 카테고리의 다른 글

관계 데이터 모델  (0) 2022.04.10
데이터 모델링  (0) 2022.04.10
데이터베이스 관리 시스템  (0) 2022.04.09
데이터베이스 기본개념  (0) 2022.04.09

데이터베이스 관리 시스템의 등장 배경

파일시스템 : 데이터를 파일로 관리할 수 있도록 파일을 생성-삭제-수정-검색하는 기능을 제공하며, 운영체제와 함께 설치된다.
파일시스템의 단점

  • 같은 내용의 데이터가 여러 파일에 중복 저장된다.응용 프로그램별로 파일을 유지하므로, 같은 데이터가 여러 파일에 저장 -> 데이터 일관성/무결성 유지 힘듬
  • 응용 프로그램이 데이터 파일에 종속적이다.파일의 데이터를 구성하는 방법이나 물리적인 저장 구조에 맞게 작성되어야 한다. 즉, 구조가 변경되면 응용프로그램도 변경해야한다.
  • 데이터 파일에 대한 동시 공유, 보안, 회복 기능이 부족하다.
  • 응용 프로그램을 개발하기 쉽지 않다.데이터 관리를 응용 프로그램이 담당해야 하기 때문에 응용 프로그램 개발이 힘들다.

데이터베이스 관리 시스템의 정의

데이터베이스 관리 시스템(DBMS: DataBase Management System): 파일 시스템의 데이터 중복과 데이터 종속 문제를 해결하기 위해 제시된 소프트웨어로, 조직에 필요한 데이터를 데이터베이스에 통합하여 저장하고 이에 대한 관리를 집중적으로 담당한다.(CRUD, 공유 등의 기능 제공)

데이터베이스 관리 시스템은 중복성, 종속성, 동시 공유, 보안, 회복, 데이터 독립성 문제를 모두 해결해준다.

데이터베이스의 주요기능

  • 정의기능: 데이터베이스 구조를 정의하거나 수정할 수 있다.
  • 조작기능: 데이터를 삽입-삭제-수정-검색하는 연산을 할 수 있다.
  • 제어기능: 데이터를 항상 정확하고 안전하기 유지할 수 있다.

데이터베이스 관리 시스템의 장-단점

1. 데이터베이스 관리 시스템의 장점
  • 데이터 중복을 통제할 수 있다.
  • 데이터 독립성이 확보된다. : 종속성문제 해결
  • 데이터를 동시 공유할 수 있다. : 동시접근
  • 데이터 보안이 향상된다. : 접근제어
  • 데이터 무결성을 유지할 수 있다. : 데이터에대한 연산시 유효성 검사를 하므로서 무결성 유지
  • 표준화할 수 있다. : 데이터에 대한 모든 접근이 DBMS를 통해 이루어지기에, 접근 방식/데이터 형식/구조 표준화 가능
  • 장애 발생 시 회복이 가능하다. : 회복기능
  • 응용 프로그램 개발 비용이 줄어든다. : 데이터관리는 DBMS이 담당 + 데이터 독립성 유지(유지보수 쉬움)
2. 데이터베이스 관리 시스템의 단점
  • 비용이 많이 든다.
  • 백업과 회복 방법이 복잡하다.
  • 중앙 집중 관리로 인한 취약점이 존재한다. : DB/DBMS에 장애 발생하면 전체 마비

데이터베이스 관리 시스템의 발전 과정

1. 1세대 데이터베이스 관리 시스템 : 네트워크-계층 DBMS
  • 네트워크 DBMS
    노드와 간선을 이용한 그래프 형태로 구성하는 네트워크 데이터 모델 -> 구조가 복잡, 변경 힘듬
  • 계층 DBMS
    데이터베이스를 트리 형태로 구성하는 계층 데이터 모델 -> 네트워크 DBMS보다 단순 but 트리로만 데이터 표현은 어렵고, 구조 변경 여전히 어렵다.
2. 2세대 데이터베이스 관리 시스템 : 관계 DBMS

테이블 형태로 데이터를 구성 -> 단순/이해하기 쉬운 구조

3. 3세대 데이터베이스 관리 시스템 : 객체지향-객체관계 DBMS
  • 객체지향 DBMS
    객체라는 개념을 이용해 데이터 베이스를 구성 -> 사용자 정의 Type사용, 비정형 데이터 다루기 등 기존에 없던 요구사항을 해결
  • 객체관계 DBMS
    객체지향 DBMS + 관계 DBMS (장점만)
4. 4세대 데이터베이스 관리 시스템 : NoSQL-NewSQL DBMS
  • NoSQL
    데이터 구조를 미리 정해두지 않음 -> 안정성과 일관성유지를 위한 복잡한 기능 포기, 확장성 증가, 분산처리 특화
  • NewSQL
    안정성과 일관성을 유지하면서도 SQL을 이용해 다양하고 복잡한 데이터 처리를 편하게 요청할 수 있음, 관계 DBMS + NoSQL (장점만)

'DB' 카테고리의 다른 글

관계 데이터 모델  (0) 2022.04.10
데이터 모델링  (0) 2022.04.10
데이터베이스 시스템  (0) 2022.04.09
데이터베이스 기본개념  (0) 2022.04.09

데이터베이스의 필요성

  1. 데이터와 정보

    데이터(data) : 현실 세계에서 단순히 관찰하거나 측정하여 수집한 사실이나 값으로, 자료라고도 한다.

    정보(information) : 데이터를 의사 결정에 유용하게 활용할 수 있도록 처리하여 체계적으로 조직한 결과물

    정보처리(information processing) : 데이터에서 정보를 추출하는 과정 또는 방법(데이터를 상황에 맞게 분석하거나 해석하여 데이터간의 의미관계를 파악하는 것)

  2. 정보 시스템과 데이터베이스

    정보시스템(information system) : 조직 운영에 필요한 데이터를 수집하여 저장해두었다가 의사 결정이 필요할 때 처리하여 유용한 정보를 만들어주는 수단

    • 데이터베이스 : 정보 시스템 안에서 데이터를 저장하고 있다가 필요할 때 제공하는 역할

데이터베이스의 정의와 특징

  1. 데이터베이스의 정의

    데이터베이스: 특정 조직의 여러 사용자가 공유하여 사용할 수 있도록 통합해서 저장운영 데이터의 집합

    • 공유 데이터: 여러 사용자가 함계 소유하고 이용할 수 있어야한다.

    • 통합 데이터: 데이터의 중복을 최소화하고 통제가 가능한 중복만 허용하는 데이터이다.

    • 저장 데이터: 컴퓨터가 접근할 수 있는 매체에 데이터베이스를 저장해야한다.

    • 운영 데이터: 지속적으로 유지해야하는 데이터이다.

  2. 데이터베이스의 특징

    • 실시간 접근이 가능하다: 사용자의 데이터 요구에 실시간으로 응답할 수 있어야 한다.

    • 계속 변화 한다: 데이터베이스는 동적인 특징이 있어 데이터를 계속 삽입, 삭제, 수정하여 현재의 정확한 데이터를 유지해야한다.

    • 동시 공유가 가능하다: 여러 사용자가 동시에 이용할 수 있다.

    • 내용으로 참조가 가능하다: 데이터베이스는 저장된 주소나 위치가 아닌 데이터의 내용, 즉 값으로 참조할 수 있다.

데이터 과학 시대의 데이터

  1. 형태에 따른 데이터 분류

    • 정형 데이터: 구조화된 데이터, 즉 미리 정해진 구조에 따라 저장된 데이터이다. (ex. 엑셀, RDB 등)

    • 반정형 데이터: 구조에 따라 저장된 데이터이지만 정형데이터와 달리 데이터 내용 안에 구조에 대한 설명이 존재한다. 따라서 데이터 내용에 대한 설명, 즉 구조를 파악하는 파싱과정이 필요하고, 보통 파일 형태로 저장된다.(ex. HTML, XML, JSON 등)

    • 비정형 데이터: 정해진 구조가 없이 저장된 데이터다.(ex. SNS텍스트, 이미지, 음성, 영상, 워드 등)

  2. 특성에 따른 데이터 분류

    • 범주형 데이터: 종류를 나타내는 값을 가진 데이터(남자/여자, 1학년/2학년/3학년 등) + 연산이 의미가 없다.

      -> 명목형 데이터: 서열이 없는 값을 가지는 데이터(성별)

      -> 순서형 데이터: 서열이 있는 값을 가진 데이터(학년)

    • 수치형 데이터(양적 데이터): 양적 측면에서 크기 비교와 산술적인 연산이 가능한 숫자 값을 가진 데이터

      -> 이산형 데이터: 단절된 숫자 값을 가지는 데이터

      -> 연속형 데이터: 연속적으로 이어진 숫자 값을 가지는 데이터

'DB' 카테고리의 다른 글

관계 데이터 모델  (0) 2022.04.10
데이터 모델링  (0) 2022.04.10
데이터베이스 시스템  (0) 2022.04.09
데이터베이스 관리 시스템  (0) 2022.04.09

+ Recent posts