빅데이터분석기사 필기 12일차 -2
Part04 빅데이터 결과 해석
Chapter02 분석 결과 해석 및 활용
Section01 분석 결과 시각화
1) 데이터 시각화 정의
- 데이터의 분석 결과를 쉽게 이해할 수 있도록 시각적으로 표현하고 전달하는 과정과 기법
- 이미지와 도표 등으로 표현하여 정보를 명확하고 효과적으로 전달하는 것을 목적으로 함
▶ 데이터 시각화 유사 개념
연관 개념 | 내용 |
정보 시각화 | 추상화된 데이터를 사람이 인지하기 쉽도록 시각화하여 표현하는 것 |
시각적 분석 | 상호작용이 가능한 시각적 인터페이스를 사용해 분석적 추론을 진행하는 과정 |
정보 디자인 | 정보를 효과적으로 전달하기 위한 수단 |
인포그래픽 | 복잡한 수치나 글로 표현되어 있는 정보와 지식을 한눈에 파악할 수 있도록 시각적으로 표현하는 것 |
▶ 데이터의 유형
유형 | 특징 | |
범주형 | 명목형 데이터 | 특정 카테고리가 갖을 수 있는 값의 집합(성별, 색깔, 취미, 혈액형 등) |
순서형 데이터 | 특정 카테고리가 갖을 수 있는 값이 순서로 구분할 수 있는 데이터(5점 척도, 학점) | |
수치형 | 이산형 데이터 | 셀 수 있는 형태의 값을 표현하는 자료(반별 학생수, 불량품수, 나이 등) |
연속형 데이터 | 연속인 어떤 구간에서 값을 취하는 자료(시간, ,온도, 무게, 길이 등) |
▶ 데이터 시각화 방법
시각화 방법 | 주요 도구 |
시간 시각화 | 막대그래프, 누적막대그래프, 점 / 선 그래프 |
분포 시각화 | 히스토그램, 파이차트, 도넛차트, 트리맵, 누적연속그래프 |
관계 시각화 | 산점도, 버블차트, 히트맵 |
비교 시각화 | 히트맵, 체르노프페이스, 스타차트, 평행좌표계, 다차원척도법 |
공간 시각화 | 지도 매핑 |
2) 시간 시각화
- 시간에 따른 데이터의 변화를 표현하는 것
- 막대그래프 : 데이터 값을 길이로 표현한 막대를 배치함으로써 상대적인 차이를 한눈에 알아보도록 표현하는 방법
- 누적막대그래프 : 막대그래프와 달리 두 개 이상의 변수를 동시에 다루는 경우 사용
- 묶은막대그래프 : 누적막대그래프와 같이 두 개 이상의 변수를 동시에 다루는 경우 사용
- 점그래프
- 꺾은선그래프 : 점그래프에서 점과 점 사이를 선으로 연결한 그래프로 데이터의 연속된 특성을 표현
- 계단그래프 : 변화가 생길 때까지 일정한 선을 유지하다가 다음 값으로 바뀌는 지점에서 급격하게 변화하는 것
- 추세선 : 데이터 값의 즉각적인 변화보다는 변화하는 경향성을 보여주는 직선 또는 곡선
3) 분포 시각화
- 데이터의 분포를 시각적으로 표현하는 기법
- 히스토그램
- 원그래프(파이 차트) : 하나의 원을 구성하는 데이터의 비율에 따라 조각으로 나누어서 데이터의 분포를 표현
- 도넛 차트 : 막대그래프를 누적하고 도넛 모양으로 만든 형태, 원그래프가 면적으로 분포비율을 표현하는데 반해 도넛차트는 면적이 아닌 길이로 데이터 값의 정도를 표현
- 트리맵 : 전체 데이터를 표현하는 하나의 사각형 영역에 세부 사각형들의 크기로 데이터의 분포를 시각화하여 표현
- 누적연속그래프 : 시간 변화에 따른 값의 변화를 선 그래프의 영역으로 표현
4) 관계 시각화
- 데이터 사이의 관계를 시각적으로 표현하는 것
- 산점도 : 두 변수의 값을 2차원(또는 3차원) 좌표계를 활용하여 점으로 표시한 것
- 버블 차트 : x, y값의 위치를 표시하는 산점도에 점의 위치에 해당하는 제3의 변수값을 원의 크기로 표현한 그래프
- 히트맵 : 데이터 분포와 관계에 대한 정보를 색으로 표현한 그래프
5) 비교 시각화
- 하나 이상의 변수에 대해서 변수 사이의 차이와 유사성 등을 표현하는 방법
- 히트맵
- 체르노프 페이스 : 데이터 표현에 따라 달라지는 차이를 얼굴의 모양으로 나타내는 방법
- 스타 차트 : 하나의 공간에 각각의 변수를 표현하는 몇 개의 축을 그리고, 축에 표시된 해당 변수의 값들을 연결하여 별 모양으로 표현하는 그래프
- 평행 좌표계
- 다차원척도법 : 모든 변수를 비교해서 비슷한 대상을 그래프 상에 가깝게 배치하는 방법
체르노프 페이스 | 스타차트 | 다차원척도법 |
6) 공간 시각화
= 장소나 지역에 따른 데이터의 분포를 표현하는 것
- 단계 구분도 : 여러 지역에 걸친 정량 정보를 나타낼 때, 데이터가 분포된 지역별로 색을 다르게 칠한 지도
- 카토그램 : 데이터 값의 변화에 따라 지도의 면적을 인위적으로 왜곡하여 데이터 값에 대한 직관적인 이해가 가능하도록 한 다이어그램
단계구분도 | 카토그램 |
참고 : 이기적 빅데이터분석기사 필기 교재
'빅데이터' 카테고리의 다른 글
빅데이터분석기사 필기 - 빅데이터 플랫폼 (0) | 2021.03.26 |
---|---|
빅데이터분석기사 필기 13일차 (0) | 2021.03.25 |
빅데이터분석기사 필기 12일차 -1 (0) | 2021.03.24 |
빅데이터분석기사 필기 11일차 -2 (0) | 2021.03.23 |
빅데이터분석기사 필기 11일차 -1 (0) | 2021.03.23 |
TAGS.