[빅데이터분석기사 실기] - 작업형 1유형

 

6월 19일 빅데이터 분석기사 실기 시험에 앞서 예시 문제가 올라와있다.

총 단답형 10문제 30점, 작업형 제1 유형 3개 30점, 작업형 제2 유형 1개 40점으로 총 100점 만점, 180분간 시험을 보게 된다.


위의 문제는 단답형 예시문제이다. 유형 당 1문제씩 총 3문제가 올라와있다.


위의 문제는 작업형 제 1유형 예시문제이다. 이 글에서는 이 문제에 대한 실습을 진행할 것이다.

제 2유형 예시문제는 다음 글에서 포스팅할 예정이다!

 


Question 1
mtcars 데이터셋(mtcars.csv)의 qsec 컬럼을 최소 최대 척도(min - max scale)로 변환한 후 0.5보다 큰 값을 가지는 레코드 수를 구하시오.

 

mtcars 데이터셋은 dataq 홈페이지에 올라와있다.

일단 데이터를 불러온다.

import pandas as pd

df = pd.read_csv('mtcars.csv')
df.head()

문제에서 qsec의 컬럼을 최소 최대 척도로 변환하는 것이므로 우리는 qsec 컬럼만 보면 될 것이다.

일단 qsec 컬럼의 데이터를 살펴보자.

X = df['qsec']
X

qsec 컬럼의 데이터를 살펴봤다.

이제 우리는 qsec의 최소 최대 척도를 살펴볼 것이다.

X를 qsec 컬럼의 데이터로 지정했기 때문에 공식은 (X - X의 최솟값) / (X의 최댓값 - X의 최솟값)으로 볼 수 있다.

따라서 코드로는 이렇게 나타낸다.

X_scale = (X - X.min()) / (X.max() - X.min())
X_scale

실행결과는 아래와 같다.

변환을 완료했으니 0.5보다 큰 값을 찾으면 끝이다.

X_scale_len = len(X_scale[X_scale >= 0.5])
X_scale_len

총 9개가 나오게 된다. 이렇게 되면 작업형 제 1유형 문제는 다 풀어봤다.

생각보다 1유형의 문제는 간단하게 볼 수 있었다.

2유형의 문제가 배점이 40점이기 때문에 만만치 않을 거란 생각이 들었다.

2유형 문제를 풀어보고 머릿속에 익히는 감각을 좀 더 길러야겠다.

TAGS.

Comments