공부/빅데이터분석기사
[빅데이터분석기사] 분석 작업 계획, 분석 프로젝트 관리
Blackshoot
2021. 8. 31. 06:52
반응형
1. 분석 프로젝트
분석 프로젝트는 과제 형태로 도출된 분석 기회를 프로젝트화하여 그 가치를 증명하기 위한 수단이다.
<분석 프로젝트의 특징>
- 데이터 영역과 비즈니스 영역에 대한 이해와 더불어 지속적인 반복이 요구되는 분석 프로세스의 특성을 이해하여 프로젝트 관리방안을 수립해야 한다.
- 지속적인 개선 및 변경을 염두해 두고 프로젝트 기한 내에 가능한 최선의 결과를 도출할 수 있도록 프로젝트 구성원들과 협업이 필요하다.
<분석 프로젝트의 추가적 속성>
- 데이터를 다루면서 분석 모형을 생성하는 프로젝트 특성상 아래 표의 추가적인 중점 관리 영역을 고려하여야 한다.
관리 영역 | 내용 |
데이터 크기 (Data Size) |
데이터가 지속적으로 생성되어 증가하는 점을 고려한다. |
데이터 복잡도 (Data Complexity) |
정형, 비정형 데이터와 다양한 시스템에 산재되어 있는 원천 데이터들을 통합하는 진행이 필요하다. 데이터에 잘 적용될 수 있는 분석 모형의 선정 등을 사전에 고려하여야 한다. |
속도 (Speed) |
분석 결과가 도출되어 이를 활용하는 시나리오 측면에서의 속도까지 고려하여야 한다. 프로젝트 수행 시 분석 모형의 성능과 속도를 고려한 개발과 테스트 수행을 고려하영야 한다. |
분석 모형의 복잡도 (Analytic Model Complexity) |
분석 모형의 정확도와 복잡도는 Trade off 관계에 있다. 분석 모형이 복잡할수로 정확도는 상승하지만 해석이 어려워지므로 이에 대한 기준을 정의하고 최적 모형을 탐색해야 한다. |
정확도와 정밀도 (Accuracy & Precision) |
분석 결과를 활용한 측면에서는 Accuracy가 중요하다. 분석 모형의 안정성 측면에서는 Precision이 중요하다. Accuracy와 Precision은 Trade off인 경우가 많다. |
▶ 정확도와 정밀도의 관점
구분 | 내용 |
![]() |
낮은 정확도, 낮은 정밀도 - 예측값들이 실제값과 멀리 떨어져 있고 예측값끼리도 멀리 떨어져 있다. - 편향(Bias)도 높고 분산(Variance)도 높다. |
![]() |
낮은 정확도, 높은 정밀도 - 예측값들이 실제값과 멀리 떨어져 있지만 예측값끼리는 모여 있다. - 편향은 높고 분산은 낮다. |
![]() |
높은 정확도, 낮은 정밀도 - 예측값들은 실제값에 가까이 있으나 예측값끼리는 떨어져 있다. - 편향은 낮고 분산은 높다. |
![]() |
높은 정확도, 높은 정밀도 - 예측값들과 실제값이 거의 같으며 모여 있다. - 편향과 분산 모두 낮다. |
<분석가의 역할>
- 분석가는 데이터 영역과 비즈니스 영역의 중간에서 현황을 이해하고 분석 모형을 통한 조율을 수행하는 조정자의 역할과 분석 프로젝트 관리 역할을 수행한다.
2. 분석 프로젝트 관리
<효율적인 데이터 분석 수행을 위한 필요성>
- 범위, 일정, 품질, 이슈 및 리스트, 의사소통 등 영역별로 고려해야 하는 요소가 많아 체계적 관리가 필요하다.
<분석 프로젝트의 관리 방안>
- 분석 프로젝트는 데이터 분석이 갖는 기본 특성(5V)을 살려 프로젝트 관리 지침을 만들어 기본 가이드로 활용해야 한다.
- 프로젝트 관리 영역에 대한 주요한 사항들은 체크포인트 형태로 관리되어야 한다.
3. 분석 프로젝트의 영역별 주요 관리 항목
<범위 관리(Scope Management)>
- 분석 기획 단계에서 명시한 프로젝트 범위는 분석을 수행하면서 데이터의 형태와 양 또는 적용되는 모형의 알고리즘에 따라 빈번하게 변경되곤 하며 이것은 프로젝트를 지연시키는 중대한 사유가 된다.
- 분석의 최종 결과물이 분석 보고서 형태인지 시스템인지에 따라 투입되는 자원과 범위가 크게 달라지므로 사전에 충분히 고려되어야 한다.
<일정 관리(Time Management)>
- 분석 프로젝트는 초기에 의도했던 모형이나 결과가 쉽게 나오는 경우가 흔치 않으며, 지속적으로 반복하는 과정에서 많은 시간이 소모되곤 한다.
- 분석 결과의 품질을 보장한다는 전제하에 Time Boxing 기법으로 일정을 관리하는 것이 필요하다.
<원가 관리(Cost Management)>
- 외부 데이터를 활용하여 데이터 분석을 수행하는 경우 데이터 구입 및 수집을 위해 많은 비용이 소모될 수 있으므로 사전에 충분한 조사가 필요하다.
- 프로젝트를 수행하는 과정에서 목표한 결과를 달성하기 위해 오픈 소스 도구를 사용하지 않고 고가의 상용 도구를 사용하게 될 경우 비용이 증가한다.
<품질 관리(Quality Management)>
- 분석 프로젝트의 수행 결과에 대한 품질목표를 사전협의를 통해 수립하고 통제하여야 한다.
- 프로젝트 품질은 품질관리계획과 품질통제 및 품질보증으로 구성되어 있으며, 이를 잘 나누어 수행하여야 한다.
<통합 관리(Integration Management)>
- 프로젝트 관리 프로세스들을 통합적으로 운영될 수 있도록 관리하여야 한다.
<조달 관리(Procurement Management)>
- 상황에 따라 분석 프로젝트 목적에 적합한 범위 내에서 외부에 아웃소싱을 수행할 수 있다.
- PoC(Proof od Concept)와 같이 지속성이 보장되지 않은 프로젝트는 인프라 구매보다 클라우드와 같은 대여방식을 고려해 볼 필요가 있다.
<인적자원 관리(Human Resource Management)>
- 분석 프로젝트는 인적자원과 데이터가 핵심이므로, 프로젝트 수행 전 전문인력 확보와 고용유지 방안을 검토하여야 한다.
- 전문인력의 효율적인 운영을 위해 핵심인재의 전문분야와 보유역량 및 수준 등을 관리하고, 프로젝트별 투입 시점과 피로도 등을 종합적으로 관리한다.
<위험 관리(Risk Management)>
- 분석 프로젝트 진행 과정에서 발생할 수 있는 위험을 식별하고, 위험으 분석하여 대응방안을 수립해야 한다.
<의사소통 관리(Communication Management)>
- 프로젝트의 원활한 진행을 위한 다양한 의사소통 채널과 모든 이해관계자가 분석 결과를 공유할 수 있도록 시각화와 같은 방안을 마련해야 한다.
<이해관계자 관리(Stakeholder Management)>
- 분석 프로젝트에 영향을 미치는 이해관계자와 참여하는 데이터, 분석, 비즈니스, 시스템 등의 전문가들을 잘 관리하여야 한다.
반응형