빅데이터분석기사 필기 - 분석 로드맵, 분석 방법론
더보기
ii 데이터 분석 계획
분석 로드맵
- 단계별로 추진하고자 하는 목표를 명확히 정의하고, 선 후행 단계를 고려해 단계별 추진내용 정렬
● 분석 로드맵 단계
단계 | 추진과제 | 추진목표 |
데이터 분석체계 도입 |
- 분석 기회 발굴 - 분석 과제 정의 - 로드맵 수립 |
- 비즈니스 약점이 무엇인지 식별 - 분석 과제를 정의하고 로드맵 수립 |
데이터 분석 유효성 검증 |
- 분석 알고리즘 설계 - 아키텍처 설계 - 분석 과제 파일럿 수행 |
- 분석 과제에 대한 파일럿 수행 - 유효성, 타당성을 검증 - 기술 실현 가능성을 검증 - 분석 알고리즘 및 아키텍처 설계 |
데이터 분석 확산 및 고도화 |
- 변화관리 - 시스템 구축 - 유관 시스템 고도화 |
- 검증된 분석 과제를 업무 프로세스에 내재화하기 위한 변화관리 실시 - 빅데이터 분석, 활용 시스템 구축 및 유관시스템을 고도화 |
● 하향식 접근 방식(Top Down Approach)
- 분석 과제가 정해져 있고 이에 대한 해법을 찾기 위해 체계적으로 분석하는 방법
● 하향식 분석 과제 발굴 절차
단계 | 내용 |
문제 탐색 | - 비즈니스 모델 기반 문제 탐색 - 분석 기회 발굴의 범위 확장 - 외부 참조 모델 기반 문제 탐색 - 분석 유스케이스 정의 |
문제 정의 | - 사용자 관점에서 비즈니스 문제를 데이터 문제로 변환하여 정의 - 필요한 데이터 및 기법 정의 |
해결방안 탐색 | - 정의된 문제를 해결하기 위해 분석기법 및 역량에 따라 다양한 방안으로 탐색 - 데이터, 시스템, 인력 등에 따라 소요되는 예산 및 활용 가능한 도구를 다양하게 고려 |
타당성 검토 | - 제시된 대안에 대한 타당성 평가 수행 - 경제적 타당성 검토 - 데이터 및 기술적 타당성 검토 - 운영적 타당성 검토 |
선택 | - 여러 대안 중 타당성에 입각하여 최적 대안의 선택하여 이를 프로젝트화하고 계획 단계의 입력 정보로 설정함 |
● 상향식 접근 방식
- 문제 정의 자체가 어려운 경우 데이터를 기반으로 문제를 지속적으로 개선하는 방식
● 대상별 분석 기획 유형
분석의 대상(What) | |||
Known | Un-Known | ||
분석의 방법 (How) |
Known | Optimization | Insight |
Un-Known | Solution | Discovery |
● 빅데이터 분석 방법론
- 빅데이터를 분석하기 위해 문제를 정의하고 답을 도출하기 위한 체계적인 절차와 처리 방법
● 빅데이터 분석 방법론 계층
계층 | 설명 |
단계(Phase) | - 프로세스 그룹을 통하여 완성된 단계별 산출물이 생성, 기준선으로 설정 관리하며, 버전 관리 등을 통한 통제 |
태스크(Task) | - 단계를 구성하는 단위 활동, 물리적 또는 논리적 단위로 품질 검토의 항목이 될 수 있음 |
스텝(Step) | - 입력자료, 처리 및 도구, 출력자료로 구성된 단위 프로세스 |
● 빅데이터 분석 방법론의 분석 절차
- 분석 기획(Planning)
- 데이터 준비(Preparing)
- 데이터 분석(Analyzing)
- 시스템 구현(Developing)
- 평가 및 전개(Deploying)
● KDD 분석 방법론
- 프로파일링 기술을 기반으로 통계적 패턴이나 지식을 찾기 위해 체계적으로 정리한 방법론
● KDD 분석 방법론의 분석 절차
- 데이터 세트 선택(Selection)
- 데이터 전처리(Preprocessing)
- 데이터 변환(Transformation)
- 데이터 마이닝(Data Mining)
- 데이터 마이닝 결과 / 평가(Interpretation / Evaluation)
● CRISP-DM 분석 방법론
- 비즈니스의 이해를 바탕으로 데이터 분석 목적의 6단계로 진행되는 데이터 마이닝 방법론
● CRISP-DM 분석 방법론의 구성
구성 | 설명 |
단계(Phase) | - 최상위 레벨 |
일반화 태스크(Generic Tasks) | - 데이터 마이닝의 단일 프로세스를 완전하게 수행하는 단위 - 각 단계는 일반화 태스크 포함 |
세분화 태스크(Specialized Tasks) | - 일반화 태스크를 구체적으로 수행하는 레벨 |
프로세스 실행(Process Instances) | - 데이터 마이닝을 위한 구체적인 실행 |
● CRISP-DM 분석 방법론의 분석 절차
- 업무 이해(Business Understanding)
- 데이터 이해(Data Understanding)
- 데이터 준비(Data Preparation)
- 모델링(Modeling)
- 평가(Evaluation)
- 전개(Deployment)
● SEMMA 분석 방법론
● SEMMA 분석 방법론의 분석 절차
- 샘플링(Sampling)
- 탐색(Exploration)
- 수정(Modification)
- 모델링(Modeling)
- 검증(Assessment)
'빅데이터' 카테고리의 다른 글
빅데이터분석기사 필기 - 데이터 전처리(1) (0) | 2021.04.02 |
---|---|
빅데이터분석기사 필기 - 데이터 수집 방식 및 기술 (0) | 2021.03.31 |
빅데이터분석기사 필기 - 개인정보보호법, 제도 (0) | 2021.03.29 |
빅데이터분석기사 필기 - 빅데이터 플랫폼 (0) | 2021.03.26 |
빅데이터분석기사 필기 13일차 (0) | 2021.03.25 |
TAGS.