빅데이터분석기사 필기 - 분석 모형 설계
● 통계기반 분석 모형 구분 설명 기술 통계 - 데이터 분석의 목적으로 수집된 데이터를 확률 통계적으로 정리 요약하는 기초적인 통계 상관 분석 - 두 개 이상의 변수 간에 존재하는 상호 연관성의 정도를 측정하여 분석하는 방법 회귀 분석 - 하나 이상의 독립변수들이 종속...
● 통계기반 분석 모형 구분 설명 기술 통계 - 데이터 분석의 목적으로 수집된 데이터를 확률 통계적으로 정리 요약하는 기초적인 통계 상관 분석 - 두 개 이상의 변수 간에 존재하는 상호 연관성의 정도를 측정하여 분석하는 방법 회귀 분석 - 하나 이상의 독립변수들이 종속...
● 탐색적 데이터 분석의 4가지 주제 주제(특징) 내용 저항성 (Resistance) - 수집된 자료에 오류점, 이상값이 있을 때에도 영향을 적게 받는 성질을 의미 잔차 해석 (Residual) - 잔차를 구해봄으로써 데이터의 보통과 다른 특징을 탐색 자료 재표현 (R...
● 데이터 이상값 발생 원인 발생 원인 설명 데이터 입력 오류 - 데이터를 수집하는 과정에서 발생할 수 있는 에러 ex) 100을 입력해야 하는데, 1000을 입력하면 10배의 값으로 입력 측정 오류 - 데이터를 측정하는 과정에서 발생하는 에러 ex) 몸무게를 측정하는...
● 데이터 오류 원인 원인 설명 오류 처리 방법 예 결측값(Missing Value) - 필수적인 데이터가 입력되지 않고 누락된 값 - 중심 경향값 넣기 - 분포기반 처리 노이즈(Noise) - 실제는 입력되지 않았지만 입력되었다고 잘못 판단된 값 - 평균값, 중간값 ...
더보기 iii 데이터 수집 및 저장 계획 ● 정형 데이터 수집 방식 및 기술 수집 방식 및 기술 설명 ETL - Extract Transform Load의 약자 - 수집 대상 데이터를 추출, 가공(변환, 정제)하여 데이터 웨어하우스 및 데이터 마트에 저장하는 기술 FT...
더보기 ii 데이터 분석 계획 분석 로드맵 - 단계별로 추진하고자 하는 목표를 명확히 정의하고, 선 후행 단계를 고려해 단계별 추진내용 정렬 ● 분석 로드맵 단계 단계 추진과제 추진목표 데이터 분석체계 도입 - 분석 기회 발굴 - 분석 과제 정의 - 로드맵 수립 - 비...
더보기 i 빅데이터 분석 기획 개인정보보호 - 정보 주체(개인)의 개인정보 자기 결정권을 철저히 보장하는 활동 ● 빅데이터 개인정보 가이드라인 구분 주요 내용 개인정보 비식별화 - 수집 시부터 개인 식별 정보에 대한 철저한 비식별화 조치 - 공개 정보 및 이용 내역 정...
더보기 ⅰ빅데이터 분석 기획 빅데이터 플랫폼 ▷ 빅데이터에서 가치를 추출하기 위해 일련의 과정(수집 > 저장 > 처리 > 분석 > 시각화)을 규격화한 기술 ▷ 특화된 분석(의료, 환경, 범죄, 자동차 등)을 지원하는 빅데이터 플랫폼이 발전하는 추세 ● 빅데이터 플랫폼 ...