세모로그
세모로그

파이썬
파이썬 데이터 분석 실무 테크닉 100 -머신러닝(3)
2021.06.02
2부 머신러닝 5장 회원 탈퇴를 예측하는 테크닉 10 분석 목표 : 의사결정 트리를 통해 탈퇴를 예측하는 흐름 배우기 전제조건 No. 파일 이름 개요 1 use_log.csv 스포츠 센터의 이용 이력 데이터. 기간은 2018년 4월 ~ 2019년 3월 2 customer_master.csv 2019년 3월 말 시점의 회원 데이터 3 class_master.csv 회원 구분 데이터(종일, 주간, 야간) 4 campaign_master.csv 캠페인 구분 데이터(입회비 무료 등) 5 customer_join.csv 3장에서 작성한 이용 이력을 포함한 고객 데이터 6 use_log_months.csv 4장에서 작성한 이용 이력을 연월 / 고객별로 집계한 데이터 테크닉041 : 데이터를 읽어 들이고 이용 데이터..

파이썬
파이썬 데이터 분석 실무 테크닉 100 -머신러닝(2)
2021.06.01
2부 머신러닝 4장 고객의 행동을 예측하는 테크닉 10 분석 목표 : 앞에서 사전 분석한 스포츠 센터 회원의 행동 정보를 이용해서 머신러닝으로 예측한다. 전제조건 No. 파일 이름 개요 1 use_log.csv 스포츠 센터의 이용 이력 데이터. 기간은 2018년 4월 ~ 2019년 3월 2 customer_master.csv 2019년 3월 말의 회원 데이터 3 class_master.csv 회원 구분 데이터(종일, 주간, 야간) 4 campaign_master.csv 캠페인 구분 데이터(입회비 무료 등) 5 customer_join.csv 3장에서 작성한 이용 이력을 포함한 고객 데이터 테크닉031 : 데이터 읽기 데이터를 읽으면서 결측치 상황도 확인! end_date 이외에는 결측치가 0인 것을 확인..

파이썬
[파이썬 실습] Logistic Regression 실습
2021.05.31
Linear Regression(선형 회귀) 실습 1. 모듈 불러오기 2. 데이터 불러오기 - 357명의 정상 환자, 212명의 유방암 환자가 존재 - X 변수 및 Y 변수 확인 - breast_cancer.target ( 0 - 유방암, 1 - 정상) ★ 작업 편의 상 - 타겟 값이 0과 같으면 1로 변경하고 아닐 경우 0으로 변경한다는 조건문 실행 3. 데이터 전처리하기 - random seed를 넣어주는 이유는 train과 test를 나누는 것이 random으로 갖고 하기 때문에 고정시켜주고 작업을 시킨다는 의미! - 각 변수 별 표준 정규화도 실시 4. 로지스틱 회귀 모델 구축하기 4.1 모델 학습하기 - 학습된 모델을 통해 베타값 도출하자. 4.2 β 확인하기 # 데이터 컬럼에 따른 beta, ..

파이썬
[파이썬 실습] Linear Regression 실습
2021.05.28
Linear Regression(선형 회귀) 실습 1. 모듈 불러오기 load_boston : 패키지에서 제공하는 공공데이터로 1978년 보스턴 주택 가격에 대한 데이터이다. 데이터 구조 : 관측치 개수 : 506개 변수 개수 : 설명변수 : 13개 / 반응변수 : 1개 - 설명변수(원인 : 예측값을 설명할 수 있는 변수) CRIM : 범죄율 INDUS : 비소매상업지역 면적비율 NOX : 일산화질소 농도 RM : 주택당 방 수 LSTAT : 인구 중 하위 계층 비율 B : 인구 중 흑인 비율 PTRATIO : 학생 / 교사 비율 ZN : 25,000 평방피트를 초과 거주지역 비율 CHAS : 찰스강의 경계에 위치한 경우 1, 아니면 0 AGE : 1940년 이전에 건축된 주택의 비율 RAD : 방사형 ..

파이썬
파이썬 데이터 분석 실무 테크닉 100 -머신러닝(1)
2021.05.26
2부 머신러닝 3장 고객의 전체 모습을 파악하는 테크닉 10 분석 목표 : 머신러닝을 하기 위한 데이터 가공 시술을 배우면서 고객 행동을 분석하고 파악하는 노하우 배우기 전제조건 종일 회원, 주간 회원, 야간 회원으로 구분 No. 파일 이름 개요 1 use_log.csv 센터의 이용 이력 데이터, 기간은 2018년 4월 ~ 2019년 3월 2 customer_master.csv 2019년 3월 말 시점의 회원 데이터 3 class_master.csv 회원 구분 데이터(종일, 주간, 야간) 4 campaign_master.csv 행사 구분 데이터(입회비 유무) 테크닉021 : 데이터 읽기 import pandas as pd uselog = pd.read_csv('use_log.csv') print(len(..