공부/빅데이터분석기사

[빅데이터분석기사] 분석 작업 계획, 분석 절차와 작업 계획

Blackshoot 2021. 8. 31. 06:02
반응형

1. 분석 절차

분석 절차는 데이터 분석의 시발점이 되는 문제 인식에서부터 시작하여 데이터를 확보하고 분석하여 결과를 도출 및 제시하는 단계까지의 일반적인 과정을 정형화한 프로세스이다.

<분석 절차의 특징>

  • 데이터 분석을 수행하기 위한 기본적인 과정을 명시하고 있다.
  • 분석 방법론을 구성하는 최소 요건이다.
  • 상황에 따라 단계를 추가할 수도 있으며 생략 가능하다.

<일반적인 분석 절차>

구분 내용
문제 인식 문제를 인식하고 분석 목적을 명확하게 정의한다.
분석 주제는 가설 형태 또는 결과 해석을 중심으로 할 수 있다.
연구조사 문제 해결을 위한 각종 문헌을 조사하고 내용을 바탕으로 문제에 대한 해결방안을 정의한다.
중요한 요인이나 변수들을 파악한다.
모형화 복잡한 문제를 논리적이면서도 단순화하는 과정이다.
많은 변수가 포함된 현실 문제를 특징적 변수로 정의한다.
문제를 변수들 간의 관계로 정의한다.
데이터 수집 데이터 수집 또는 변수를 측정하는 과정이다.
기존 데이터 활용이 불가능한 경우 추가적인 데이터 수립을 고려한다.
데이터 분석 수집된 데이터로부터 인사이트를 발굴한다.
수집된 데이터로부터 변수들간의 관계를 분석한다.
분석 결과 제시 변수들 간 인과관계나 상관관계를 포함한 분석 결과를 제시하고 공유한다.
표, 그림, 차트, 그래프 등을 활용하여 시각화한다.

<분석 절차 적용 시 고려사항>

  • 문제에 대한 구체적 정의가 가능하고, 필요 데이터를 보유하고 있으며, 분석역량을 갖추고 있다면 통계 기반의 전통적 데이터 분석을 수행할 수 있다.
  • 문제에 대한 구체적 정의가 없다면 데이터 마이닝 기반으로 데이터를 분석하여 인사이트를 발굴하거나 일단 데이터 분석을 시도한 후 결과를 확인해 가면서 반복적으로 도출해 볼 수 있다.

2. 작업 계획

분석 작업 계획은 분석 절차에 따라 데이터 분석 업무를 수행하기 위한 전반적인 작업 내용들을 세부적으로 정의하는 과정이다.

<분석 작업 계획 수립>

단계 내용
프로젝트
소요비용 배분
주어진 시스템 및 데이터 환경을 고려하여 현실성 있는 계획이 되도록 프로젝트 일정을 수립한다.
사전에 작성해 놓은 데이터 분석목표정의서의 내용의 모두 반영될 수 있도록 한다.
프로젝트
작업분할구조 수립
데이터 분석목표정의서와 프로젝트 소요비용 배분 계획을 참고하여 데이터 분석 절차에 맞게 수립한다.
프로젝트
업무 분장 계획 및 배분
배분된 인건비를 기준으로 단계별 인원 투입 계획을 수립하고 역할별로 작성해야 하는 필수 산출물을 정의한다.
프로젝트 유관부서 리더들과 프로젝트 참여 인원을 중심으로 프로젝트 평가위원회를 구성한다.
상황에 따라 외부 자문 위원을 참여시킨다.

<분석 작업 계획 수립을 위한 작업분할구조(WBS: Work Breakdown Structure) 작성>

단계 내용
데이터
분석과제 정의
데이터 분석목표정의서를 기준으로 프로젝트 전체 일정에 맞춰 사전에 준비한다.
각 단계별 필요 산출물과 보고서 작성 시기, 세부 일정 등을 정리한다.
데이터
준비 및 탐색
데이터 엔지니어가 데이터를 수집하고 정리하는 일정을 수립한다.
데이터 분석가가 분석에 필요한 데이터들로부터 변수 후보를 탐색하고 최종 산출물을 도출하는 일정을 수립한다.
데이터 분석 가설을 세우고 유의미한 검정을 수행하는 일정을 포함한다.
데이터 분석
모델링 및 검증
실험방법 및 절차를 구분하고 검증하는 내용과 수행일정을 상세하게 수립한다.
데이터 분석 모델링 작업이 1회 이상 수행되므로 검증일정을 고려하여 세부 일정을 수립한다.
산출물 정리 데이터 분석 단계별 산출물을 정리하고, 모델링 과정에서 개발된 분석 스크립트를 최종 산출물로 정리한다.
전체 일정에서 산출물 정리 과정을 반드시 포함시킨다.

3. 분석목표정의서

문제의 개선뱡향에 맞는 현실적인 분석목표를 수립하여 필요한 데이터에 대한 정보나 분석 타당성 검토 및 성과측정 방법 등을 정리한 정의서이다.

<분석목표정의서 구성요소>

  • 원천 데이터 조사
구분 내용
데이터 정보 데이터 축적기간, 획득 주기, 테이블 스키마, 메타 데이터를 확인한다.
데이터 수집
난이도
데이터 수집 및 정제 과정, 시기와 방법을 확인한다.
데이터 수집 난이도가 높을 경우 데이터 활용을 재고한다.
  • 분석 방안 및 적용 가능성 판단

- 개선 목표와 현시점의 분석 목표 간 차이를 고려하여 분석 목표를 조정하거나 상황에 따라 우선순위를 조정한다.

- 분석 목표에 부합한 데이터 분석 기법이 있더라도 현재 적합한 분석 환경이 구축되지 않았다면 분석 목표를 조정한다.

성과평가 기준

구분 내용
정성적 평가 분석 기법이나 기술의 활용 가능성을 평가한다.
신규 데이터나 외부 데이터의 활용 가능성을 평가한다.
이 외 관련 시스템별로 정성적 요소를 평가한다.
정량적 평가 기존 방법 대비 효과의 증감 비율을 평가한다.
유효한 가설의 수나 목표 대비 증감 비율을 평가한다.
데이터 모형의 정확도를 측정하여 평가한다.
기타 분석 특성에 따른 자체 KPI에 의한 성과를 측정한다.

<분석목표정의서 작성 방법>

  • 분석 목적을 설정하고 이를 달성하기 위한 세부 목표를 수립한다.
  • 필요한 데이터를 정의하고, 분석 방법과 데이터 수집 및 분석 난이도, 수행 주기, 분석 결과에 대한 검증 기준을 설계한다.
  • 도메인 이슈 도출을 통한 개선 방향을 토대로 목표 수준을 정리한다.
반응형