공부/빅데이터분석기사

[빅데이터분석기사] 분석 작업 계획, 분석 작업 개요

Blackshoot 2021. 8. 31. 04:53
반응형

분석 작업 계획을 수립하기 위해 데이터 처리 프로세스 전체에 대한 이해가 필요하며, 데이터 처리 영역과 데이터 분석 영역으로 나우어 살펴볼 수 있다.

데이터 처리 프로세스

1. 데이터 처리 영역

데이터 분석을 위한 기초 데이터를 정의하고 수집 및 저장, 분석하기 수월하도록 물리적인 환경을 제공하는 영역이다.

단계 내용
데이터 소스  기업 내 각 부서나 서비스별 적재되고 있는 내부 데이터와 다른 기업이나 공공 데이터 등 외부 데이터가 있다.
데이터 수집 사용자로부터 데이터를 직접 입력받거나 로그수집기, 크롤링, 센서네트워크 등을 통해 데이터를 수집한다.
데이터 저장 데이터를 유형별로 나눠 최적의 설계를 하여 데이터 스토리지에 저장한다.
데이터 처리 저장된 대용량의 데이터를 신속하고 정확하게 처리하기 위하여 실시간 처리 및 분산 처리 등을 시도한다.

2. 데이터 분석 영역

저장되어 있는 데이터를 추출하여 분석 목적과 방법에 맞게 가공한 후, 데이터 분석을 직접 수행하고 그 결과를 표현하는 영역이다.

<데이터 분석 - NCS(국가직무능력표준)>

구분 내용
도메인 이슈 도출 분석 대상 과제 현황을 파악하고 개선과제를 정의했다.
문제의 주요 이슈별로 개선방향을 도출하고, 개선방안을 수립하며, 빅데이터 요건 정의서를 작성한다.
분석목표 수립 빅데이터 요건 정의서를 토대로 개선방향에 맞는 현실적인 분석목표를 수립한다.
데이터 관련 정보, 분석 타당성 검토, 성과측정 방법 등을 포함한 분석목표정의서를 작성한다.
프로젝트 계획 수리 사전에 책정된 자원과 예산, 기간 등을 고려하여 분석 프로젝트 계획을 수립한다.
분석목표정의서, 프로젝트 소요비용 배분계획을 바탕으로 작업분할구조도(WBS)를 작성한다.
보유 데이터 자산 확인 분석목표와 프로젝트 계획을 기반으로 현재 보유 중인 데이터의 품질이나 규모, 유형 등을 확인하고 법률적 이슈나 제약사항 등을 검토한다.

<데이터 표현>

구분 내용
빅데이터 분석 결과
시각화
다양한 분석 및 시각화 도구를 활용하여 분석 결과를 시각화 한다.

 

반응형