빅데이터분석기사 필기 8일차 -1
Part03 빅데이터 모델링
Chapter01 분석 모형 설계
Section01 분석 절차 수립
1) 분석 모형 선정 필요성
- 분석 기법 또는 분석 알고리즘을 적용하기 전에 분석 모형에 대한 선정이 필요함
(1) 분석 모형 선정 프로세스
- 문제요건 정의 또는 비즈니스 이해에 따른 대상 데이터 선정과 분석 목표 / 조건 정의
- 데이터 수집, 정리 및 도식화
- 데이터 전처리
- 분석 모형 선정
2) 분석 모형 정의와 종류
① 예측 분석 모형 : 적조 예측, 날씨 예측, 주가 예측, 범죄 / 위험 예측, 쇼핑 아이템 추천
② 현황 진단 모형 : 과거 데이터를 통해 현재 상황을 객관적으로 진단하는 모형
③ 최적화 분석 모형 : 제한된 자원, 환경 내에서 최대의 효용성, 이익과 같은 결과를 생성하기 위함
▶ 분석 모형 정의와 판별을 위한 평가기준표 예시
판단 근거 | |
필요성 | 개인이나 기관 관점에서 분석 과제가 필요한지 판단 |
파급효과 | 정성적, 정량적 기대효과의 정도 판단 |
추진 시급성 | 당장 해소되어야 할 사회현안 여부 판단, 장기과제 성격 분리 |
구현 가능성 | 과제를 구현함에 있어서 어려움이 없는지 현실성 판단 |
데이터 수집 가능성 | 공공기관 협조나 데이터 확보, 데이터 구매 등 제약사항 판단 |
모델 확장성 | 과제가 시범과제로 끝나지 않고 전체 데이터 모델로 확장 가능한지 판단 |
① 상향식(Bottom-up) 접근 : 특정 영역을 지정하여 의사결정 지점으로 진행하는 과정에서 분석 기회를 발굴하는 방식
② 분석 유스케이스 기반 접근 : 분석 테마 후보 그룹을 활용하고 연관된 분석 기회를 발굴하는 방식
3) 분석 모형 구축 절차
- 분석 시나리오 작성
- 분석 모형 설계
(1) 통계적 가설 검정
- 통계적 추측의 하나로서, 모집단의 실제 값이 얼마가 된다는 주장에 대해 표본의 정보를 사용해서 가설의 합당성 여부를 판정하는 과정
① 유의수준 결정, 귀무가설과 대립가설 설정
② 검정통계량의 설정
③ 기각역의 설정
기각역 : 확률분포에서 귀무가설을 기각하는 영역
④ 검정통계량 계산
신뢰수준 : 가설을 검정할 때 어느 정도로 검정할 것인지에 대한 수준
유의수준 : 가설을 검정할 때 일정 수준을 벗어나면 귀무가설이 오류라고 판단하는 수준
⑤ 통계적인 의사결정(가설검정) > 양측검정, 단측검정
참고 : 이기적 빅데이터분석기사 필기 교재
'빅데이터' 카테고리의 다른 글
빅데이터분석기사 필기 9일차 -1 (0) | 2021.03.20 |
---|---|
빅데이터분석기사 필기 8일차 -2 (0) | 2021.03.19 |
빅데이터분석기사 필기 7일차 -2 (0) | 2021.03.18 |
빅데이터분석기사 필기 7일차 -1 (0) | 2021.03.18 |
빅데이터분석기사 필기 6일차 -2 (0) | 2021.03.16 |