반응형
1. 데이터베이스의 정의
- 체계적이거나 조직적으로 정리되고 전자식 or 기타 수단으로 개별적으로 접근할 수 있는 독립된 저작물, 데이터 or 기타 소재의 수집물이다.
- 동시에 복수의 적용 업무를 지원할 수 있도록 복수 이용자의 요구에 대응해서 데이터를 받아들이고 저장, 공급하기 위해 일정한 구조에 따라 편성된 데이터의 집합.
- 문자, 기호, 음성, 화상, 영상 등 상호 관련된 다수의 콘텐츠를 정보 처리 및 정보통신 기기에 의하여 체계적으로 수집, 축적하여 다양한 용도와 방법으로 이용할 수 있도록 정리한 정보의 집합체이다.
2. 데이터베이스 관리 시스템
종류 | 설명 |
관계형 DBMS | 데이터를 열과 행을 이루는 테이블로 표현하는 모델이다 |
객체지향 DBMS | 정보를 객체 형태로 표현하는 모델이다 |
네트워크 DBMS | 그래프 구조를 기반으로 하는 모델이다 |
계층형 DBMS | 트리 구조를 기반으로 하는 모델이다 |
- SQL
- 데이터베이스에 접근할 때 사용하는 언어이다.
- 단순한 질의 기능뿐만아니라 데이터 정의와 조작 기능을 갖추고 있다.
- 테이블 단위로 연산을 수행하며 초보자들도 비교적 쉽게 사용 가능하다.
3. 데이터베이스의 특징
- 통합된 데이터
동일한 데이터가 중복되어 저장되지 않음을 의미한다.
- 저장된 데이터
컴퓨터가 접근할 수 있는 저장매체에 데이터를 저장한다.
- 공용 데이터
여러 사용자가 서로 다른 목적으로 데이터를 함께 이용한다.
- 변화되는 데이터
데이터는 현시점의 상태를 나타내며 지속적으로 갱신된다.
▶데이터베이스의 장단점
장점 | 단점 |
데이터 중복 최소화 실시간 접근 가능 데이터 보안 강화 논리적 및 물리적 독립성 제공 데이터 일관성 제공 데이터 무결성 보장 데이터 공유 용이 |
구축과 유지에 따른 비용 발생 백업과 복구 등 관리 필요 |
4. 데이터베이스의 활용
- OLTP(OnLine Transaction Processing)
- 여러 단말에서 보내온 메시지에 따라 호스트 컴퓨터가 데이터베이스를 엑세스하고, 바로 처리 결과를 돌려보내는 형태를 말한다.
- 현재 시점의 데이터만을 데이터베이스가 관리한다는 개념이다.
- OLAP(OnLine Analytical Processing)
다양한 비즈니스 관점에서 쉽고 빠르게 다차원적인 데이터에 접근하여 의사결정에 활용할 수 있는 정보를 얻을 수 있게 하는 기술이다.
구분 | OLTP | OLAP |
데이터 구조 | 복잡 | 단순 |
데이터 갱신 | 동적으로 순간적 | 정적으로 주기적 |
응답 시간 | 수 초 이내 | 수 초에서 몇 분 사이 |
데이터 범위 | 수 십일 전후 | 오랜 기간 저장 |
데이터 성격 | 정규적인 핵심 데이터 | 비정규적 읽기 전용 데이터 |
데이터 크기 | 수 기가바이트 | 수 테라바이트 |
데이터 내용 | 현재 데이터 | 요약된 데이터 |
데이터 특성 | 트랜젝션 중심 | 주제 중심 |
데이터 액세스 빈도 | 높음 | 보통 |
질의 결과 예측 | 주기적이며 예측 가능 | 예측하기 어려움 |
5. 데이터 웨어하우스
▶데이터 웨어하우스 특징
특징 | 내용 |
주제지향성 | 고객, 제품 등과 같은 중요한 주제를 중심으로 그 주제와 관련된 데이터들로 구성된다. |
통합성 | 데이터가 데이터 웨어하우스에 입력될 때는 일관된 형태로 변환되며, 전사적인 관점에서 통합된다. |
시계열성 | 데이터 웨어하우스의 데이터는 일정 기간 동안 시점별로 이어진다. |
비휘발성 | 데이터 웨어하우스에 일단 데이터가 적재되면 일괄 처리 작업에 의한 갱신 이외에는 변경이 수행되지 않는다. |
▶데이터 웨어하우스 구성
구성 요소 | 내용 |
데이터 모델 | 주제 중심적으로 구성된 다차원의 개체-관계형 모델로 설계된다. |
ETL (Extract, Transtorm, Load) |
기업의 내부 or 외부로부터 데이터를 추출, 정제 및 가공하여 데이터 웨어하우스에 적재한다. |
ODS (Operational Data Store) |
다양한 DBMS 시스템에서 추출한 데이터를 통합적으로 관리한다. |
DW 메타데이터 | 데이터 모델에 대한 스키마 정보와 비즈니스 측면에서 활용되는 정보를 제공한다. |
OLAP | 사용자가 직접 다차원의 데이터를 확인할 수 있는 솔류션이다. |
데이터마이닝 | 대용량의 데이터로부터 인사이트를 도출할 수 있는 방법론이다. |
분석 도구 | 데이터마이닝을 활용하여 데이터 웨어하우스에 적재된 데이터를 분석할 수 있는 도구이다. |
경영기반 솔루션 | KMS,DSS, BI와 같은 경영의사결저을 지원하기 위한 솔루션이다. |
반응형
'공부 > 빅데이터분석기사' 카테고리의 다른 글
[빅데이터분석기사] 빅데이터 기술 및 제도, 빅데이터 플랫폼 (0) | 2021.08.12 |
---|---|
[빅데이터분석기사] 빅데이터 개요 및 활용, 빅데이터 조직 및 인력 (0) | 2021.08.12 |
[빅데이터분석기사] 빅데이터 개요 및 활용, 데이터 산업 (0) | 2021.08.12 |
[빅데이터분석기사] 빅데이터 개요 및 활용, Big Data (0) | 2021.08.12 |
[빅데이터분석기사] 빅데이터 개요 및 활용, 데이터 (0) | 2021.08.11 |