빅데이터분석기사 필기 - 분석 로드맵, 분석 방법론

더보기

ii 데이터 분석 계획

 

분석 로드맵

- 단계별로 추진하고자 하는 목표를 명확히 정의하고, 선 후행 단계를 고려해 단계별 추진내용 정렬

 

● 분석 로드맵 단계

단계 추진과제 추진목표
데이터
분석체계 도입
- 분석 기회 발굴
- 분석 과제 정의
- 로드맵 수립
- 비즈니스 약점이 무엇인지 식별
- 분석 과제를 정의하고 로드맵 수립
데이터 분석
유효성 검증
- 분석 알고리즘 설계
- 아키텍처 설계
- 분석 과제 파일럿 수행
- 분석 과제에 대한 파일럿 수행
- 유효성, 타당성을 검증
- 기술 실현 가능성을 검증
- 분석 알고리즘 및 아키텍처 설계
데이터 분석
확산 및 고도화
- 변화관리
- 시스템 구축
- 유관 시스템 고도화
- 검증된 분석 과제를 업무 프로세스에 내재화하기 위한 변화관리 실시
- 빅데이터 분석, 활용 시스템 구축 및 유관시스템을 고도화

 


 

● 하향식 접근 방식(Top Down Approach)

- 분석 과제가 정해져 있고 이에 대한 해법을 찾기 위해 체계적으로 분석하는 방법

 

● 하향식 분석 과제 발굴 절차

단계 내용
문제 탐색 - 비즈니스 모델 기반 문제 탐색
- 분석 기회 발굴의 범위 확장
- 외부 참조 모델 기반 문제 탐색
- 분석 유스케이스 정의
문제 정의 - 사용자 관점에서 비즈니스 문제를 데이터 문제로 변환하여 정의
- 필요한 데이터 및 기법 정의
해결방안 탐색 - 정의된 문제를 해결하기 위해 분석기법 및 역량에 따라 다양한 방안으로 탐색
- 데이터, 시스템, 인력 등에 따라 소요되는 예산 및 활용 가능한 도구를 다양하게 고려
타당성 검토 - 제시된 대안에 대한 타당성 평가 수행
- 경제적 타당성 검토
- 데이터 및 기술적 타당성 검토
- 운영적 타당성 검토
선택 - 여러 대안 중 타당성에 입각하여 최적 대안의 선택하여 이를 프로젝트화하고 계획 단계의 입력 정보로 설정함

 


 

● 상향식 접근 방식

- 문제 정의 자체가 어려운 경우 데이터를 기반으로 문제를 지속적으로 개선하는 방식

 

● 대상별 분석 기획 유형

  분석의 대상(What)
Known Un-Known
분석의 방법
(How)
Known Optimization Insight
Un-Known Solution Discovery

 


 

● 빅데이터 분석 방법론

- 빅데이터를 분석하기 위해 문제를 정의하고 답을 도출하기 위한 체계적인 절차와 처리 방법

 

● 빅데이터 분석 방법론 계층

계층 설명
단계(Phase) - 프로세스 그룹을 통하여 완성된 단계별 산출물이 생성, 기준선으로 설정 관리하며, 버전 관리 등을 통한 통제
태스크(Task) - 단계를 구성하는 단위 활동, 물리적 또는 논리적 단위로 품질 검토의 항목이 될 수 있음
스텝(Step) - 입력자료, 처리 및 도구, 출력자료로 구성된 단위 프로세스

 

● 빅데이터 분석 방법론의 분석 절차

  1. 분석 기획(Planning)
  2. 데이터 준비(Preparing)
  3. 데이터 분석(Analyzing)
  4. 시스템 구현(Developing)
  5. 평가 및 전개(Deploying)

● KDD 분석 방법론

- 프로파일링 기술을 기반으로 통계적 패턴이나 지식을 찾기 위해 체계적으로 정리한 방법론

 

● KDD 분석 방법론의 분석 절차

  1. 데이터 세트 선택(Selection)
  2. 데이터 전처리(Preprocessing)
  3. 데이터 변환(Transformation)
  4. 데이터 마이닝(Data Mining)
  5. 데이터 마이닝 결과 / 평가(Interpretation / Evaluation)

 


 

● CRISP-DM 분석 방법론

- 비즈니스의 이해를 바탕으로 데이터 분석 목적의 6단계로 진행되는 데이터 마이닝 방법론

 

● CRISP-DM 분석 방법론의 구성

구성 설명
단계(Phase) - 최상위 레벨
일반화 태스크(Generic Tasks) - 데이터 마이닝의 단일 프로세스를 완전하게 수행하는 단위
- 각 단계는 일반화 태스크 포함
세분화 태스크(Specialized Tasks) - 일반화 태스크를 구체적으로 수행하는 레벨
프로세스 실행(Process Instances) - 데이터 마이닝을 위한 구체적인 실행

● CRISP-DM 분석 방법론의 분석 절차

  1. 업무 이해(Business Understanding)
  2. 데이터 이해(Data Understanding)
  3. 데이터 준비(Data Preparation)
  4. 모델링(Modeling)
  5. 평가(Evaluation)
  6. 전개(Deployment)

● SEMMA 분석 방법론

 

● SEMMA 분석 방법론의 분석 절차

  1. 샘플링(Sampling)
  2. 탐색(Exploration)
  3. 수정(Modification)
  4. 모델링(Modeling)
  5. 검증(Assessment)

 

TAGS.

Comments