데이터베이스의 필요성

  1. 데이터와 정보

    데이터(data) : 현실 세계에서 단순히 관찰하거나 측정하여 수집한 사실이나 값으로, 자료라고도 한다.

    정보(information) : 데이터를 의사 결정에 유용하게 활용할 수 있도록 처리하여 체계적으로 조직한 결과물

    정보처리(information processing) : 데이터에서 정보를 추출하는 과정 또는 방법(데이터를 상황에 맞게 분석하거나 해석하여 데이터간의 의미관계를 파악하는 것)

  2. 정보 시스템과 데이터베이스

    정보시스템(information system) : 조직 운영에 필요한 데이터를 수집하여 저장해두었다가 의사 결정이 필요할 때 처리하여 유용한 정보를 만들어주는 수단

    • 데이터베이스 : 정보 시스템 안에서 데이터를 저장하고 있다가 필요할 때 제공하는 역할

데이터베이스의 정의와 특징

  1. 데이터베이스의 정의

    데이터베이스: 특정 조직의 여러 사용자가 공유하여 사용할 수 있도록 통합해서 저장운영 데이터의 집합

    • 공유 데이터: 여러 사용자가 함계 소유하고 이용할 수 있어야한다.

    • 통합 데이터: 데이터의 중복을 최소화하고 통제가 가능한 중복만 허용하는 데이터이다.

    • 저장 데이터: 컴퓨터가 접근할 수 있는 매체에 데이터베이스를 저장해야한다.

    • 운영 데이터: 지속적으로 유지해야하는 데이터이다.

  2. 데이터베이스의 특징

    • 실시간 접근이 가능하다: 사용자의 데이터 요구에 실시간으로 응답할 수 있어야 한다.

    • 계속 변화 한다: 데이터베이스는 동적인 특징이 있어 데이터를 계속 삽입, 삭제, 수정하여 현재의 정확한 데이터를 유지해야한다.

    • 동시 공유가 가능하다: 여러 사용자가 동시에 이용할 수 있다.

    • 내용으로 참조가 가능하다: 데이터베이스는 저장된 주소나 위치가 아닌 데이터의 내용, 즉 값으로 참조할 수 있다.

데이터 과학 시대의 데이터

  1. 형태에 따른 데이터 분류

    • 정형 데이터: 구조화된 데이터, 즉 미리 정해진 구조에 따라 저장된 데이터이다. (ex. 엑셀, RDB 등)

    • 반정형 데이터: 구조에 따라 저장된 데이터이지만 정형데이터와 달리 데이터 내용 안에 구조에 대한 설명이 존재한다. 따라서 데이터 내용에 대한 설명, 즉 구조를 파악하는 파싱과정이 필요하고, 보통 파일 형태로 저장된다.(ex. HTML, XML, JSON 등)

    • 비정형 데이터: 정해진 구조가 없이 저장된 데이터다.(ex. SNS텍스트, 이미지, 음성, 영상, 워드 등)

  2. 특성에 따른 데이터 분류

    • 범주형 데이터: 종류를 나타내는 값을 가진 데이터(남자/여자, 1학년/2학년/3학년 등) + 연산이 의미가 없다.

      -> 명목형 데이터: 서열이 없는 값을 가지는 데이터(성별)

      -> 순서형 데이터: 서열이 있는 값을 가진 데이터(학년)

    • 수치형 데이터(양적 데이터): 양적 측면에서 크기 비교와 산술적인 연산이 가능한 숫자 값을 가진 데이터

      -> 이산형 데이터: 단절된 숫자 값을 가지는 데이터

      -> 연속형 데이터: 연속적으로 이어진 숫자 값을 가지는 데이터

'DB' 카테고리의 다른 글

관계 데이터 모델  (0) 2022.04.10
데이터 모델링  (0) 2022.04.10
데이터베이스 시스템  (0) 2022.04.09
데이터베이스 관리 시스템  (0) 2022.04.09

+ Recent posts