공부/빅데이터분석기사

[빅데이터분석기사] 분석 작업 계획, 분석 프로젝트 관리

Blackshoot 2021. 8. 31. 06:52
728x90
반응형

1. 분석 프로젝트

분석 프로젝트는 과제 형태로 도출된 분석 기회를 프로젝트화하여 그 가치를 증명하기 위한 수단이다.

<분석 프로젝트의 특징>

  • 데이터 영역과 비즈니스 영역에 대한 이해와 더불어 지속적인 반복이 요구되는 분석 프로세스의 특성을 이해하여 프로젝트 관리방안을 수립해야 한다.
  • 지속적인 개선 및 변경을 염두해 두고 프로젝트 기한 내에 가능한 최선의 결과를 도출할 수 있도록 프로젝트 구성원들과 협업이 필요하다.

<분석 프로젝트의 추가적 속성>

  • 데이터를 다루면서 분석 모형을 생성하는 프로젝트 특성상 아래 표의 추가적인 중점 관리 영역을 고려하여야 한다.
관리 영역 내용
데이터 크기
(Data Size)
데이터가 지속적으로 생성되어 증가하는 점을 고려한다.
데이터 복잡도
(Data Complexity)
정형, 비정형 데이터와 다양한 시스템에 산재되어 있는 원천 데이터들을 통합하는 진행이 필요하다.
데이터에 잘 적용될 수 있는 분석 모형의 선정 등을 사전에 고려하여야 한다.
속도
(Speed)
분석 결과가 도출되어 이를 활용하는 시나리오 측면에서의 속도까지  고려하여야 한다.
프로젝트 수행 시 분석 모형의 성능과 속도를 고려한 개발과 테스트 수행을 고려하영야 한다.
분석 모형의 복잡도
(Analytic Model Complexity)
분석 모형의 정확도와 복잡도는 Trade off 관계에 있다.
분석 모형이 복잡할수로 정확도는 상승하지만 해석이 어려워지므로 이에 대한 기준을 정의하고 최적 모형을 탐색해야 한다.
정확도와 정밀도
(Accuracy & Precision)
분석 결과를 활용한 측면에서는 Accuracy가 중요하다.
분석 모형의 안정성 측면에서는 Precision이 중요하다.
Accuracy와 Precision은 Trade off인 경우가 많다.

▶ 정확도와 정밀도의 관점

구분 내용
낮은 정확도, 낮은 정밀도
- 예측값들이 실제값과 멀리 떨어져 있고 예측값끼리도 멀리 떨어져 있다.
- 편향(Bias)도 높고 분산(Variance)도 높다.
낮은 정확도, 높은 정밀도
- 예측값들이 실제값과 멀리 떨어져 있지만 예측값끼리는 모여 있다.
- 편향은 높고 분산은 낮다.
높은 정확도, 낮은 정밀도
- 예측값들은 실제값에 가까이 있으나 예측값끼리는 떨어져 있다.
- 편향은 낮고 분산은 높다.
높은 정확도, 높은 정밀도
- 예측값들과 실제값이 거의 같으며 모여 있다.
- 편향과 분산 모두 낮다.

<분석가의 역할>

  • 분석가는 데이터 영역과 비즈니스 영역의 중간에서 현황을 이해하고 분석 모형을 통한 조율을 수행하는 조정자의 역할과 분석 프로젝트 관리 역할을 수행한다.

2. 분석 프로젝트 관리

<효율적인 데이터 분석 수행을 위한 필요성>

  • 범위, 일정, 품질, 이슈 및 리스트, 의사소통 등 영역별로 고려해야 하는 요소가 많아 체계적 관리가 필요하다.

<분석 프로젝트의 관리 방안>

  • 분석 프로젝트는 데이터 분석이 갖는 기본 특성(5V)을 살려 프로젝트 관리 지침을 만들어 기본 가이드로 활용해야 한다.
  • 프로젝트 관리 영역에 대한 주요한 사항들은 체크포인트 형태로 관리되어야 한다.

3. 분석 프로젝트의 영역별 주요 관리 항목

<범위 관리(Scope Management)>

  • 분석 기획 단계에서 명시한 프로젝트 범위는 분석을 수행하면서 데이터의 형태와 양 또는 적용되는 모형의 알고리즘에 따라 빈번하게 변경되곤 하며 이것은 프로젝트를 지연시키는 중대한 사유가 된다.
  • 분석의 최종 결과물이 분석 보고서 형태인지 시스템인지에 따라 투입되는 자원과 범위가 크게 달라지므로 사전에 충분히 고려되어야 한다.

<일정 관리(Time Management)>

  • 분석 프로젝트는 초기에 의도했던 모형이나 결과가 쉽게 나오는 경우가 흔치 않으며, 지속적으로 반복하는 과정에서 많은 시간이 소모되곤 한다.
  • 분석 결과의 품질을 보장한다는 전제하에 Time Boxing 기법으로 일정을 관리하는 것이 필요하다.

<원가 관리(Cost Management)>

  • 외부 데이터를 활용하여 데이터 분석을 수행하는 경우 데이터 구입 및 수집을 위해 많은 비용이 소모될 수 있으므로 사전에 충분한 조사가 필요하다.
  • 프로젝트를 수행하는 과정에서 목표한 결과를 달성하기 위해 오픈 소스 도구를 사용하지 않고 고가의 상용 도구를 사용하게 될 경우 비용이 증가한다.

<품질 관리(Quality Management)>

  • 분석 프로젝트의 수행 결과에 대한 품질목표를 사전협의를 통해 수립하고 통제하여야 한다.
  • 프로젝트 품질은 품질관리계획과 품질통제 및 품질보증으로 구성되어 있으며, 이를 잘 나누어 수행하여야 한다.

<통합 관리(Integration Management)>

  • 프로젝트 관리 프로세스들을 통합적으로 운영될 수 있도록 관리하여야 한다.

<조달 관리(Procurement Management)>

  • 상황에 따라 분석 프로젝트 목적에 적합한 범위 내에서 외부에 아웃소싱을 수행할 수 있다.
  • PoC(Proof od Concept)와 같이 지속성이 보장되지 않은 프로젝트는 인프라 구매보다 클라우드와 같은 대여방식을 고려해 볼 필요가 있다.

<인적자원 관리(Human Resource Management)>

  • 분석 프로젝트는 인적자원과 데이터가 핵심이므로, 프로젝트 수행 전 전문인력 확보와 고용유지 방안을 검토하여야 한다.
  • 전문인력의 효율적인 운영을 위해 핵심인재의 전문분야와 보유역량 및 수준 등을 관리하고, 프로젝트별 투입 시점과 피로도 등을 종합적으로 관리한다.

<위험 관리(Risk Management)>

  • 분석 프로젝트 진행 과정에서 발생할 수 있는 위험을 식별하고, 위험으 분석하여 대응방안을 수립해야 한다.

<의사소통 관리(Communication Management)>

  • 프로젝트의 원활한 진행을 위한 다양한 의사소통 채널과 모든 이해관계자가 분석 결과를 공유할 수 있도록 시각화와 같은 방안을 마련해야 한다.

<이해관계자 관리(Stakeholder Management)>

  • 분석 프로젝트에 영향을 미치는 이해관계자와 참여하는 데이터, 분석, 비즈니스, 시스템 등의 전문가들을 잘 관리하여야 한다.
반응형