데이터베이스의 필요성
데이터와 정보
데이터(data) : 현실 세계에서 단순히 관찰하거나 측정하여 수집한 사실이나 값으로, 자료라고도 한다.
정보(information) : 데이터를 의사 결정에 유용하게 활용할 수 있도록 처리하여 체계적으로 조직한 결과물
정보처리(information processing) : 데이터에서 정보를 추출하는 과정 또는 방법(데이터를 상황에 맞게 분석하거나 해석하여 데이터간의 의미관계를 파악하는 것)
정보 시스템과 데이터베이스
정보시스템(information system) : 조직 운영에 필요한 데이터를 수집하여 저장해두었다가 의사 결정이 필요할 때 처리하여 유용한 정보를 만들어주는 수단
- 데이터베이스 : 정보 시스템 안에서 데이터를 저장하고 있다가 필요할 때 제공하는 역할
데이터베이스의 정의와 특징
데이터베이스의 정의
데이터베이스: 특정 조직의 여러 사용자가 공유하여 사용할 수 있도록 통합해서 저장한 운영 데이터의 집합
공유 데이터: 여러 사용자가 함계 소유하고 이용할 수 있어야한다.
통합 데이터: 데이터의 중복을 최소화하고 통제가 가능한 중복만 허용하는 데이터이다.
저장 데이터: 컴퓨터가 접근할 수 있는 매체에 데이터베이스를 저장해야한다.
운영 데이터: 지속적으로 유지해야하는 데이터이다.
데이터베이스의 특징
실시간 접근이 가능하다: 사용자의 데이터 요구에 실시간으로 응답할 수 있어야 한다.
계속 변화 한다: 데이터베이스는 동적인 특징이 있어 데이터를 계속 삽입, 삭제, 수정하여 현재의 정확한 데이터를 유지해야한다.
동시 공유가 가능하다: 여러 사용자가 동시에 이용할 수 있다.
내용으로 참조가 가능하다: 데이터베이스는 저장된 주소나 위치가 아닌 데이터의 내용, 즉 값으로 참조할 수 있다.
데이터 과학 시대의 데이터
형태에 따른 데이터 분류
정형 데이터: 구조화된 데이터, 즉 미리 정해진 구조에 따라 저장된 데이터이다. (ex. 엑셀, RDB 등)
반정형 데이터: 구조에 따라 저장된 데이터이지만 정형데이터와 달리 데이터 내용 안에 구조에 대한 설명이 존재한다. 따라서 데이터 내용에 대한 설명, 즉 구조를 파악하는 파싱과정이 필요하고, 보통 파일 형태로 저장된다.(ex. HTML, XML, JSON 등)
비정형 데이터: 정해진 구조가 없이 저장된 데이터다.(ex. SNS텍스트, 이미지, 음성, 영상, 워드 등)
특성에 따른 데이터 분류
범주형 데이터: 종류를 나타내는 값을 가진 데이터(남자/여자, 1학년/2학년/3학년 등) + 연산이 의미가 없다.
-> 명목형 데이터: 서열이 없는 값을 가지는 데이터(성별)
-> 순서형 데이터: 서열이 있는 값을 가진 데이터(학년)
수치형 데이터(양적 데이터): 양적 측면에서 크기 비교와 산술적인 연산이 가능한 숫자 값을 가진 데이터
-> 이산형 데이터: 단절된 숫자 값을 가지는 데이터
-> 연속형 데이터: 연속적으로 이어진 숫자 값을 가지는 데이터
'DB' 카테고리의 다른 글
관계 데이터 모델 (0) | 2022.04.10 |
---|---|
데이터 모델링 (0) | 2022.04.10 |
데이터베이스 시스템 (0) | 2022.04.09 |
데이터베이스 관리 시스템 (0) | 2022.04.09 |