공부/빅데이터분석기사

[빅데이터분석기사] 빅데이터 개요 및 활용, 데이터베이스

Blackshoot 2021. 8. 11. 23:22
반응형

1. 데이터베이스의 정의

  • 체계적이거나 조직적으로 정리되고 전자식 or 기타 수단으로 개별적으로 접근할 수 있는 독립된 저작물, 데이터 or 기타 소재의 수집물이다.
  • 동시에 복수의 적용 업무를 지원할 수 있도록 복수 이용자의 요구에 대응해서 데이터를 받아들이고 저장, 공급하기 위해 일정한 구조에 따라 편성된 데이터의 집합.
  • 문자, 기호, 음성, 화상, 영상 등 상호 관련된 다수의 콘텐츠를 정보 처리 및 정보통신 기기에 의하여 체계적으로 수집, 축적하여 다양한 용도와 방법으로 이용할 수 있도록 정리한 정보의 집합체이다.

2. 데이터베이스 관리 시스템

종류 설명
관계형 DBMS 데이터를 열과 행을 이루는 테이블로 표현하는 모델이다
객체지향 DBMS 정보를 객체 형태로 표현하는 모델이다
네트워크 DBMS 그래프 구조를 기반으로 하는 모델이다
계층형 DBMS 트리 구조를 기반으로 하는 모델이다
  • SQL

- 데이터베이스에 접근할 때 사용하는 언어이다.

- 단순한 질의 기능뿐만아니라 데이터 정의와 조작 기능을 갖추고 있다.

- 테이블 단위로 연산을 수행하며 초보자들도 비교적 쉽게 사용 가능하다.

3. 데이터베이스의 특징

  • 통합된 데이터

동일한 데이터가 중복되어 저장되지 않음을 의미한다.

  • 저장된 데이터

컴퓨터가 접근할 수 있는 저장매체에 데이터를 저장한다.

  • 공용 데이터

여러 사용자가 서로 다른 목적으로 데이터를 함께 이용한다.

  • 변화되는 데이터

데이터는 현시점의 상태를 나타내며 지속적으로 갱신된다.

 

▶데이터베이스의 장단점

장점 단점
데이터 중복 최소화
실시간 접근 가능
데이터 보안 강화
논리적 및 물리적 독립성 제공
데이터 일관성 제공
데이터 무결성 보장
데이터 공유 용이
구축과 유지에 따른 비용 발생
백업과 복구 등 관리 필요

4. 데이터베이스의 활용

  • OLTP(OnLine Transaction Processing)

- 여러 단말에서 보내온 메시지에 따라 호스트 컴퓨터가 데이터베이스를 엑세스하고, 바로 처리 결과를 돌려보내는 형태를 말한다.

- 현재 시점의 데이터만을 데이터베이스가 관리한다는 개념이다.

  • OLAP(OnLine Analytical Processing)

다양한 비즈니스 관점에서 쉽고 빠르게 다차원적인 데이터에 접근하여 의사결정에 활용할 수 있는 정보를 얻을 수 있게 하는 기술이다.

구분 OLTP OLAP
데이터 구조 복잡 단순
데이터 갱신 동적으로 순간적 정적으로 주기적
응답 시간 수 초 이내 수 초에서 몇 분 사이
데이터 범위 수 십일 전후 오랜 기간 저장
데이터 성격 정규적인 핵심 데이터 비정규적 읽기 전용 데이터
데이터 크기 수 기가바이트 수 테라바이트
데이터 내용 현재 데이터 요약된 데이터
데이터 특성 트랜젝션 중심 주제 중심
데이터 액세스 빈도 높음 보통
질의 결과 예측 주기적이며 예측 가능 예측하기 어려움

5. 데이터 웨어하우스

▶데이터 웨어하우스 특징

특징 내용
주제지향성 고객, 제품 등과 같은 중요한 주제를 중심으로 그 주제와 관련된 데이터들로 구성된다.
통합성 데이터가 데이터 웨어하우스에 입력될 때는 일관된 형태로 변환되며, 전사적인 관점에서 통합된다.
시계열성 데이터 웨어하우스의 데이터는 일정 기간 동안 시점별로 이어진다.
비휘발성 데이터 웨어하우스에 일단 데이터가 적재되면 일괄 처리 작업에 의한 갱신 이외에는 변경이 수행되지 않는다.

▶데이터 웨어하우스 구성

구성 요소 내용
데이터 모델 주제 중심적으로 구성된 다차원의 개체-관계형 모델로 설계된다.
ETL
(Extract, Transtorm, Load)
기업의 내부 or 외부로부터 데이터를 추출, 정제 및 가공하여 데이터 웨어하우스에 적재한다.
ODS
(Operational Data Store)
다양한 DBMS 시스템에서 추출한 데이터를 통합적으로 관리한다.
DW 메타데이터 데이터 모델에 대한 스키마 정보와 비즈니스 측면에서 활용되는 정보를 제공한다.
OLAP 사용자가 직접 다차원의 데이터를 확인할 수 있는 솔류션이다.
데이터마이닝 대용량의 데이터로부터 인사이트를 도출할 수 있는 방법론이다.
분석 도구 데이터마이닝을 활용하여 데이터 웨어하우스에 적재된 데이터를 분석할 수 있는 도구이다.
경영기반 솔루션 KMS,DSS, BI와 같은 경영의사결저을 지원하기 위한 솔루션이다.
반응형