반응형
1. 분석 절차
분석 절차는 데이터 분석의 시발점이 되는 문제 인식에서부터 시작하여 데이터를 확보하고 분석하여 결과를 도출 및 제시하는 단계까지의 일반적인 과정을 정형화한 프로세스이다.
<분석 절차의 특징>
- 데이터 분석을 수행하기 위한 기본적인 과정을 명시하고 있다.
- 분석 방법론을 구성하는 최소 요건이다.
- 상황에 따라 단계를 추가할 수도 있으며 생략 가능하다.
<일반적인 분석 절차>
구분 | 내용 |
문제 인식 | 문제를 인식하고 분석 목적을 명확하게 정의한다. 분석 주제는 가설 형태 또는 결과 해석을 중심으로 할 수 있다. |
연구조사 | 문제 해결을 위한 각종 문헌을 조사하고 내용을 바탕으로 문제에 대한 해결방안을 정의한다. 중요한 요인이나 변수들을 파악한다. |
모형화 | 복잡한 문제를 논리적이면서도 단순화하는 과정이다. 많은 변수가 포함된 현실 문제를 특징적 변수로 정의한다. 문제를 변수들 간의 관계로 정의한다. |
데이터 수집 | 데이터 수집 또는 변수를 측정하는 과정이다. 기존 데이터 활용이 불가능한 경우 추가적인 데이터 수립을 고려한다. |
데이터 분석 | 수집된 데이터로부터 인사이트를 발굴한다. 수집된 데이터로부터 변수들간의 관계를 분석한다. |
분석 결과 제시 | 변수들 간 인과관계나 상관관계를 포함한 분석 결과를 제시하고 공유한다. 표, 그림, 차트, 그래프 등을 활용하여 시각화한다. |
<분석 절차 적용 시 고려사항>
- 문제에 대한 구체적 정의가 가능하고, 필요 데이터를 보유하고 있으며, 분석역량을 갖추고 있다면 통계 기반의 전통적 데이터 분석을 수행할 수 있다.
- 문제에 대한 구체적 정의가 없다면 데이터 마이닝 기반으로 데이터를 분석하여 인사이트를 발굴하거나 일단 데이터 분석을 시도한 후 결과를 확인해 가면서 반복적으로 도출해 볼 수 있다.
2. 작업 계획
분석 작업 계획은 분석 절차에 따라 데이터 분석 업무를 수행하기 위한 전반적인 작업 내용들을 세부적으로 정의하는 과정이다.
<분석 작업 계획 수립>
단계 | 내용 |
프로젝트 소요비용 배분 |
주어진 시스템 및 데이터 환경을 고려하여 현실성 있는 계획이 되도록 프로젝트 일정을 수립한다. 사전에 작성해 놓은 데이터 분석목표정의서의 내용의 모두 반영될 수 있도록 한다. |
프로젝트 작업분할구조 수립 |
데이터 분석목표정의서와 프로젝트 소요비용 배분 계획을 참고하여 데이터 분석 절차에 맞게 수립한다. |
프로젝트 업무 분장 계획 및 배분 |
배분된 인건비를 기준으로 단계별 인원 투입 계획을 수립하고 역할별로 작성해야 하는 필수 산출물을 정의한다. 프로젝트 유관부서 리더들과 프로젝트 참여 인원을 중심으로 프로젝트 평가위원회를 구성한다. 상황에 따라 외부 자문 위원을 참여시킨다. |
<분석 작업 계획 수립을 위한 작업분할구조(WBS: Work Breakdown Structure) 작성>
단계 | 내용 |
데이터 분석과제 정의 |
데이터 분석목표정의서를 기준으로 프로젝트 전체 일정에 맞춰 사전에 준비한다. 각 단계별 필요 산출물과 보고서 작성 시기, 세부 일정 등을 정리한다. |
데이터 준비 및 탐색 |
데이터 엔지니어가 데이터를 수집하고 정리하는 일정을 수립한다. 데이터 분석가가 분석에 필요한 데이터들로부터 변수 후보를 탐색하고 최종 산출물을 도출하는 일정을 수립한다. 데이터 분석 가설을 세우고 유의미한 검정을 수행하는 일정을 포함한다. |
데이터 분석 모델링 및 검증 |
실험방법 및 절차를 구분하고 검증하는 내용과 수행일정을 상세하게 수립한다. 데이터 분석 모델링 작업이 1회 이상 수행되므로 검증일정을 고려하여 세부 일정을 수립한다. |
산출물 정리 | 데이터 분석 단계별 산출물을 정리하고, 모델링 과정에서 개발된 분석 스크립트를 최종 산출물로 정리한다. 전체 일정에서 산출물 정리 과정을 반드시 포함시킨다. |
3. 분석목표정의서
문제의 개선뱡향에 맞는 현실적인 분석목표를 수립하여 필요한 데이터에 대한 정보나 분석 타당성 검토 및 성과측정 방법 등을 정리한 정의서이다.
<분석목표정의서 구성요소>
- 원천 데이터 조사
구분 | 내용 |
데이터 정보 | 데이터 축적기간, 획득 주기, 테이블 스키마, 메타 데이터를 확인한다. |
데이터 수집 난이도 |
데이터 수집 및 정제 과정, 시기와 방법을 확인한다. 데이터 수집 난이도가 높을 경우 데이터 활용을 재고한다. |
- 분석 방안 및 적용 가능성 판단
- 개선 목표와 현시점의 분석 목표 간 차이를 고려하여 분석 목표를 조정하거나 상황에 따라 우선순위를 조정한다.
- 분석 목표에 부합한 데이터 분석 기법이 있더라도 현재 적합한 분석 환경이 구축되지 않았다면 분석 목표를 조정한다.
성과평가 기준
구분 | 내용 |
정성적 평가 | 분석 기법이나 기술의 활용 가능성을 평가한다. 신규 데이터나 외부 데이터의 활용 가능성을 평가한다. 이 외 관련 시스템별로 정성적 요소를 평가한다. |
정량적 평가 | 기존 방법 대비 효과의 증감 비율을 평가한다. 유효한 가설의 수나 목표 대비 증감 비율을 평가한다. 데이터 모형의 정확도를 측정하여 평가한다. 기타 분석 특성에 따른 자체 KPI에 의한 성과를 측정한다. |
<분석목표정의서 작성 방법>
- 분석 목적을 설정하고 이를 달성하기 위한 세부 목표를 수립한다.
- 필요한 데이터를 정의하고, 분석 방법과 데이터 수집 및 분석 난이도, 수행 주기, 분석 결과에 대한 검증 기준을 설계한다.
- 도메인 이슈 도출을 통한 개선 방향을 토대로 목표 수준을 정리한다.
반응형
'공부 > 빅데이터분석기사' 카테고리의 다른 글
[빅데이터분석기사] 분석 작업 계획, 분석 프로젝트 관리 (0) | 2021.08.31 |
---|---|
[빅데이터분석기사] 분석 작업 계획, 데이터 확보 계획 (0) | 2021.08.31 |
[빅데이터분석기사] 분석 작업 계획, 분석 작업 개요 (0) | 2021.08.31 |
[빅데이터분석기사] 분석 방안 수립, 빅데이터 분석 방법론 (0) | 2021.08.30 |
[빅데이터분석기사] 분석 방안 수립, 데이터 분석 방안 (0) | 2021.08.30 |