[빅데이터분석기사 실기] - 작업형 1유형
6월 19일 빅데이터 분석기사 실기 시험에 앞서 예시 문제가 올라와있다.
총 단답형 10문제 30점, 작업형 제1 유형 3개 30점, 작업형 제2 유형 1개 40점으로 총 100점 만점, 180분간 시험을 보게 된다.
위의 문제는 단답형 예시문제이다. 유형 당 1문제씩 총 3문제가 올라와있다.
위의 문제는 작업형 제 1유형 예시문제이다. 이 글에서는 이 문제에 대한 실습을 진행할 것이다.
제 2유형 예시문제는 다음 글에서 포스팅할 예정이다!
Question 1
mtcars 데이터셋(mtcars.csv)의 qsec 컬럼을 최소 최대 척도(min - max scale)로 변환한 후 0.5보다 큰 값을 가지는 레코드 수를 구하시오.
mtcars 데이터셋은 dataq 홈페이지에 올라와있다.
일단 데이터를 불러온다.
import pandas as pd
df = pd.read_csv('mtcars.csv')
df.head()
문제에서 qsec의 컬럼을 최소 최대 척도로 변환하는 것이므로 우리는 qsec 컬럼만 보면 될 것이다.
일단 qsec 컬럼의 데이터를 살펴보자.
X = df['qsec']
X
qsec 컬럼의 데이터를 살펴봤다.
이제 우리는 qsec의 최소 최대 척도를 살펴볼 것이다.
X를 qsec 컬럼의 데이터로 지정했기 때문에 공식은 (X - X의 최솟값) / (X의 최댓값 - X의 최솟값)으로 볼 수 있다.
따라서 코드로는 이렇게 나타낸다.
X_scale = (X - X.min()) / (X.max() - X.min())
X_scale
실행결과는 아래와 같다.
변환을 완료했으니 0.5보다 큰 값을 찾으면 끝이다.
X_scale_len = len(X_scale[X_scale >= 0.5])
X_scale_len
총 9개가 나오게 된다. 이렇게 되면 작업형 제 1유형 문제는 다 풀어봤다.
생각보다 1유형의 문제는 간단하게 볼 수 있었다.
2유형의 문제가 배점이 40점이기 때문에 만만치 않을 거란 생각이 들었다.
2유형 문제를 풀어보고 머릿속에 익히는 감각을 좀 더 길러야겠다.
'파이썬' 카테고리의 다른 글
[파이썬 실습] 정규화 모델 실습(2) (0) | 2021.06.07 |
---|---|
[파이썬 실습] 정규화 모델 실습(1) (0) | 2021.06.05 |
파이썬 데이터 분석 실무 테크닉 100 -머신러닝(3) (0) | 2021.06.02 |
파이썬 데이터 분석 실무 테크닉 100 -머신러닝(2) (0) | 2021.06.01 |
[파이썬 실습] Logistic Regression 실습 (0) | 2021.05.31 |