Loading...
2021. 6. 1. 22:41

파이썬 데이터 분석 실무 테크닉 100 -머신러닝(2)

2부 머신러닝 4장 고객의 행동을 예측하는 테크닉 10 분석 목표 : 앞에서 사전 분석한 스포츠 센터 회원의 행동 정보를 이용해서 머신러닝으로 예측한다. 전제조건 No. 파일 이름 개요 1 use_log.csv 스포츠 센터의 이용 이력 데이터. 기간은 2018년 4월 ~ 2019년 3월 2 customer_master.csv 2019년 3월 말의 회원 데이터 3 class_master.csv 회원 구분 데이터(종일, 주간, 야간) 4 campaign_master.csv 캠페인 구분 데이터(입회비 무료 등) 5 customer_join.csv 3장에서 작성한 이용 이력을 포함한 고객 데이터 테크닉031 : 데이터 읽기 데이터를 읽으면서 결측치 상황도 확인! end_date 이외에는 결측치가 0인 것을 확인..

2021. 5. 26. 19:26

파이썬 데이터 분석 실무 테크닉 100 -머신러닝(1)

2부 머신러닝 3장 고객의 전체 모습을 파악하는 테크닉 10 분석 목표 : 머신러닝을 하기 위한 데이터 가공 시술을 배우면서 고객 행동을 분석하고 파악하는 노하우 배우기 전제조건 종일 회원, 주간 회원, 야간 회원으로 구분 No. 파일 이름 개요 1 use_log.csv 센터의 이용 이력 데이터, 기간은 2018년 4월 ~ 2019년 3월 2 customer_master.csv 2019년 3월 말 시점의 회원 데이터 3 class_master.csv 회원 구분 데이터(종일, 주간, 야간) 4 campaign_master.csv 행사 구분 데이터(입회비 유무) 테크닉021 : 데이터 읽기 import pandas as pd uselog = pd.read_csv('use_log.csv') print(len(..

빅데이터분석기사 필기 - 분석 모형 설계

● 통계기반 분석 모형 구분 설명 기술 통계 - 데이터 분석의 목적으로 수집된 데이터를 확률 통계적으로 정리 요약하는 기초적인 통계 상관 분석 - 두 개 이상의 변수 간에 존재하는 상호 연관성의 정도를 측정하여 분석하는 방법 회귀 분석 - 하나 이상의 독립변수들이 종속변수에 미치는 영향을 추정할 수 있는 통계 기법 - 단순 회귀 : 독립변수가 1개이며, 종속변수와의 관계가 직선 - 다중 회귀 : 독립변수가 K개이며, 종속변수와의 관계가 선형(1차 함수) - 다항 회귀 : 독립변수와 종속변수와의 관계가 1차 함수 이상인 관계 - 곡선 회귀 : 독립변수가 1개이며 종속변수와의 관계가 곡선 - 로지스틱 회귀 : 종속변수가 범주형인 경우 적용 분산 분석 - 두 개 이상의 집단 간 비교를 수행하고자 할 때 집단 ..