공부/빅데이터분석기사

[빅데이터분석기사] 분석 방안 수립, 분석 문제 정의 개요

Blackshoot 2021. 8. 30. 13:29
반응형

1. 분석 문제 정의 개요

<분석 과제 도출>

분석 과제는 해결해야 할 다양한 문제들을 데이터 분석 문제로 변환하여 분석 프로젝트로 수행할 수 있는 과제정의서 형태로 도출한다.

<대표적인 분석 과제 도출 방법>

문제가 먼저 주어지고 이에 대한 해법을 찾아가는 하향식 접근 방식과 데이터를 기반으로 문제의 재정의 및 해결방안을 탐색하는 상향식 접근 방식이 있다.

<최적의 의사결정을 위한 혼합방식>

  • 동적인 환경에서 발산과 수렴 단계를 반복적으로 수행하며 상호 보완을 통해 분석의 가치를 극대화할 수 있다.
  • 상향식 접근 방식의 발산(Diverge) 단계 : 가능한 옵션을 도출
  • 하향식 접근 방식의 수렴(Converge) 단계 : 도출된 옵션을 분석하고 검증

<분석 과제 정의>

  • 분석 과제 정의서는 다양한 방식으로 도출한 분석 과제들을 명확하게 정의하여 상세하게 작성한다.

- 필요한 데이터, 데이터 수집과 분석 난이도, 분석 방법과 수행 주기, 상세 분석 과정, 분석 결과에 대한 검증 책임자 등을 포함한다.

- 분석 데이터는 조직 내부뿐만 아니라 외부 데이터도 포함하며, 데이터 유형이나 종류를 가리지 않고 범위를 확장하여 고려한다.

  • 분석 과제 정의서는 분석 프로젝틀를 수행하는 이해관계자가 프로젝트의 방향을 설정하고 성공 여부를 판단할  수 있는 자료로 사용된다.

- 분석 과제 정의서는 향후 프로젝트 수행계획의 입력물로 사용된다.

2 하향식 접근 방식

<문제 탐색 단계>

  • 개별적으로 인지하고 있는 문제를 단순하게 나열하는 것보다 전체적인 관점의 기준 모델을 활용하여 누락 없이 문제를 도출하고 식별해야 한다.
  • 현재 데이터의 소유 여부와 데이터가 없는 경우 해결방안 등에 대한 세부적인 내용보다 문제를 해결하여 발생하는 가치에 중심을 두어야 한다.
구분 내용
비즈니스 모델 기반
문제 탐색
해당 기업이 사업 모델을 도식화한 비즈니스 모델 캔버스 블록을 단순화하여 기회를 추가로 도출한다.
새로운 관점의 접근으로 새로운 유형의 분석 기회와 주제를 발굴한다.
외부 참조 모델 기반
문제 탐색
유사 또는 동종의 환경에서 기존에 수행한 분석 사례를 벤치마킹 한다.
제공되는 산업별, 업무 서비스별 분석테마 후보 그룹을 통해 빠르고 쉬운(Quick & Easy) 방식으로 접근한다.
분석 유즈 케이스
정의
도출한 분석 기회들을 구체적인 과제로 만들기 전에 분석 유즈 케이스로 정의하여야 한다.
문제에 대한 상세 설명과 기대효과를 명시하여 향후 데이터 분석 문제로의 정환 및 적합성 평가에 활용한다.

<문제 정의 단계>

  • 식별된 비즈니스 문제를 데이터적인 문제로 변환하여 정의한다.
  • 필요한 데이터와 기법을 정의하기 위한 데이터 분석 문제로 변환한다.
  • 분석 수행자 외 문제 해결 시 효용을 얻을 최종 사용자 관점에서 정의한다.

<해결방안 탐색 단계>

  • 정의된 데이터 분석 문제를 해결하기 위한 다양한 방안들을 모색한다.

- 기법 및 시스템과 분석 역량 보유 여부에 따라 세분화가 가능하다.

<타당성 평가 단계>

  • 도출된 분석 문제, 가설에 대한 대안을 과제화하기 위한 타당성을 분석한다.
경제적
타당성
비용 대비 편익 분석 관점의 접근이 필요하다.
- 항목은 데이터, 시스템, 인력, 유지보수 등 분석 비용이다.
- 편익은 분석 결과를 적용하여 발생 가능한 실질적 비용 절감, 추가적 매출과 수익 등의 경제적 가치로 산출한다.
데이터 및
기술적 타당성
데이터 분석 시 데이터, 분석 시스템 환경 분석역량이 필요하다.
기술적 타당성 분석 시 역량 확보 방안의 사전수립이 필요하다.
비즈니스 분석가, 데이터 분석가, 시스템 엔지니어 등과 협업한다.

3. 하향식 접근 방식의 문제 탐색 방법

<비즈니스 모델 캔버스를 활용한 과제 발굴>

  • 해당 기업의 사업 모델을 도식화한 비즈니스 모델 캔버스의 9가지 블록을 단순화하여 문제 발굴을 3개의 단위로, 이를 관리하는 2개의 영역으로 도출한다.
업무 단위
(Operation)
제품이나 서비스를 생산하기 위한 내부 프로세스 및 주요 자원과 관련하여 주제를 도출한다.
제품 단위
(Product)
생산 및 제공하는 제품이나 서비스를 개선하기 위한 관련 주제들을 도출한다.
고객 단위
(Customer)
제품이나 서비스를 제공받는 사용자나 고객 또는 이를 제공하는 채녈 관점에서 관련 주제들을 도출한다.
규제와 감사 영역
(Audi & Regulation)
제품 생산과 전달 과정에서 발생하는 규제나 보안 관점에서 관련 주제들을 도출한다.
지원 인프라 영역
(IT & Human Resource)
분석을 수행하는 시스템 영역과 이를 운영 및 관리하는 인력의 관점에서 관련 주제들을 도출한다.

<분석 기회 발굴의 범위 확장>

새로운 문제의 발굴이나 장기적인 접근을 위해서는 환경과 경쟁 구도의 변화 및 역량의 재해석을 통한 혁신 관점의 분석 기회 추가 도출이 필요하다.

관점  영역 내용
거시적 관점 사회 영역
(Social)
고객영역을 확장하여 전체 시장을 사회, 문화, 구조적 트렌드 변화에 기반하여 분석 기회를 도출한다.
기술 영영
(Technological)
과학, 기술, 의학 등 최신 기술의 등장변화에 따른 역량 내재화와 제품 및 서비스 개발에 대한 분석 기회를 도출한다.
환경 영역
(Environmental)
환경과 관련된 정부, 사회단체, 시만사회를 관심과 규제 동향을 파악하고 이에 대한 분석 기회를 도출한다.
정치 영역
(Political)
주요 정책방향, 정세, 지정학적 동향 등의 거시적인 흐름을 토대로 하여 분석 기회를 도출한다.
경쟁자
확대 관점
대체재 영역
(Substitude)
현재 생산하고 있는 제품 또는 서비스의 대체재를 파악하고 이를 고려한 분석 기회를 도출한다.
경쟁자 영역
(Competitor)
현재 생산하고 있는 제품이나 서비스의 주요 경쟁자에 대한 동향을 파악하여 이를 고려한 분석 기회를 도출한다.
신규 진입자 영역
(New Entrant)
향후 시장에서 파괴적인 역할을 수행할 수 있는 신규 진입자에 대한 동향을 파악하여 이를 고려한 분석 기회를 도출한다.
시장의 니즈
탐색 관점
고객영역
(Customer)
고객의 구매 동향 및 고객의 컨텍스트를 더욱 깊게 이해하여 제품 또는 서비스의 개선에 필요한 분석 기회를 도출한다.
채널 영역
(Channel)
자체 채널뿐 아니라 최종 고객에게 상품이나 서비스를 전달 가능한 모든 경로를 파악하여 경로별 채널 분석 기회를 확대하여 탐색한다.
영향자들 영역
(Influencer)
주주, 투자자, 협의 및 기타 이해관계자의 주요 관심사항에 대하여 파악하고 분석 기회를 탐색한다.
역량의 재해석
관점
내부 역량 영역
(Competency)
지식, 기술, 스킬 등 노하우와 인프라적인 유형 자산에 대해서도 폭넓게 재해석하고 해당 영역에서 분석 기회를 탐색한다.
파트너와 네트워크 영역
(Partners & Network)
관계사와 공급사 등의 역량을 활용해 수행할 수 있는 기능을 파악해 보고 이에 대한 분석 기회를 추가적으로 도출한다.

4. 상향식 접근 방식

<상향식 접근 방식의 특징>

  • 다량의 데이터 분석을 통해 외(Why) 그러한 일이 발생하는지 역으로 추적하면서 문제를 도출하거나 재정의할 수 있는 방식이다.
  • 데이터를 활용하여 생각하지도 못했던 인사이트 도출 및 시행착오를 통한 개선이 가능하다.

<상향식 접근 방식의 동장배경>

  • 기존 하향식 접근 방식은 한계를 극복하기 위해 등장하였다.

- 하향식 접근 방식은 솔루션 도출은 유효하지만 새로운 문제 탐색은 어렵다.

- 하향식 접근 방식은 복잡하고 다양한 환경에서 발생한 문제에는 부적합하다.

  • 논리적 단계별 접근법은 문제의 구조가 분명하고 이에 대한 해결책을 도출하기 위한 데이터가 분석가나 의사결정자에게 주어져 있음을 가정하고 있다.

<상향식 접근기반 전통적 분석 사고 극복방안>

  • 디자인 사고 접근법

- 현장 관찰과 감정이입, 대상 관점으로 전환을 수행한다.

- 통상적으로는 분석적으로 사물을 인식하려는 Why를 강조하나, 답을 미리 내는 것이 아니라 사물을 있는 그대로 인식하는 What 관점으로 접근한다.

- 객관적으로 존재하는 데이터 자체를 관찰하고 실제 행동으로 옮김으로써 대상을 좀 더 잘 이해하는 방식으로 접근한다.

  • 비지도 학습 방법에 의한 수행

- 목표 값을 사전에 학습하거나 정의하지 않고 데이터 자체만을 가지고 결과를 도출한다.

- 새로운 유형의 인사이트를 도출하기에 유용한 방식이다.

  • 빅데이터 환경에서의 분석

- 통계적 분석환경에서는 인과관계 분석을 위해 가설을 설정하고 이를 검증하기 위해 모집단으로부터 표본을 추출하여 가설검증을 하였다.

- 빅데이터 분석환경에서는 인과관계, 상관관게, 연관분석을 통하여 다양한 문제를 해결할 수 있다.

<상향식 접근 방식의 문제 해결 방법>

  • 프로토타이핑 접근법 : 일단 먼저 분석을 시도해 보고 그 결과를 확인하면서 반복적으로 개선해 나가는 방식이다.

- 사용자가 요구사항이나 데이터를 정확히 정의하기 어렵고 원천 데이터도 명확하지 않을 때 주로 사용한다.

- 완전하지는 않지만 신속하게 해결책이나 모형을 제시하여 이를 바탕으로 문제를 더 명확하게 인식하고 필요한 데이터를 식별하여 구체화할 수 있다.

▶ 프로토타이핑 접근법의 필요성

문제에 대한
인식 수준
문제 정의가 불명확하거나 새로운 문제일 경우 사용자나 이해 관계자는 프로토타입을 이용하여 문제를 이해하고 구체화할 수 있다.
필요 데이터
존재 여부의
불확실성
문제해결을 위해 필요한 모든 데이터가 존재하지 않을 경우, 이에 대한 수집방안이나 대체방안을 수립하여야 한다.
대체 불가능한 데이터가 존재하는지 사전에 확인하여 프로젝트가 중도에 중단되는 위험을 방지할 수 있다.
데이터 사용 목적의 가변성 데이터의 가치는 사전에 정해진 수집 목적에 따라 확정되는 것이 아니며, 그 가치가 지속적으로 변화한다.
기존에 보유 중인 데이터도 데이터 정의를 재검토하여 데이터의 사용 목적과 범위를 확대할 수 있다.

▶ 프로토타이핑 접근법의 프로세스

특징 잘 설계된 프로토타이핑을 지속하는 경우 실험이 가지고 있는 불명확성은 감소하고 의도했던 결과를 도출할 가능성이 높아진다.
빅데이터 분석환경에서는 최대한 빨리 분석 결과를 보여 주고 이를 가지고 지속적으로 반복하는 방법이 효과적이다.
구성 가설의 생성(Hypotheses)
디자인에 대한 실험(Design Experiments)
실제 환경에서의 테스트(Test)
테스트 결과에서의 통찰(Insight) 도출 및 가설 확인

 

반응형