빅데이터분석기사 필기 12일차 -2

Part04 빅데이터 결과 해석

Chapter02 분석 결과 해석 및 활용

Section01 분석 결과 시각화

 

1) 데이터 시각화 정의

- 데이터의 분석 결과를 쉽게 이해할 수 있도록 시각적으로 표현하고 전달하는 과정과 기법

- 이미지와 도표 등으로 표현하여 정보를 명확하고 효과적으로 전달하는 것을 목적으로 함

 

▶ 데이터 시각화 유사 개념

연관 개념 내용
정보 시각화 추상화된 데이터를 사람이 인지하기 쉽도록 시각화하여 표현하는 것
시각적 분석 상호작용이 가능한 시각적 인터페이스를 사용해 분석적 추론을 진행하는 과정
정보 디자인 정보를 효과적으로 전달하기 위한 수단
인포그래픽 복잡한 수치나 글로 표현되어 있는 정보와 지식을 한눈에 파악할 수 있도록 시각적으로 표현하는 것

 

▶ 데이터의 유형

유형 특징
범주형 명목형 데이터 특정 카테고리가 갖을 수 있는 값의 집합(성별, 색깔, 취미, 혈액형 등)
순서형 데이터 특정 카테고리가 갖을 수 있는 값이 순서로 구분할 수 있는 데이터(5점 척도, 학점)
수치형 이산형 데이터 셀 수 있는 형태의 값을 표현하는 자료(반별 학생수, 불량품수, 나이 등)
연속형 데이터 연속인 어떤 구간에서 값을 취하는 자료(시간, ,온도, 무게, 길이 등)

 

▶ 데이터 시각화 방법

시각화 방법 주요 도구
시간 시각화 막대그래프, 누적막대그래프, 점 / 선 그래프
분포 시각화 히스토그램, 파이차트, 도넛차트, 트리맵, 누적연속그래프
관계 시각화 산점도, 버블차트, 히트맵
비교 시각화 히트맵, 체르노프페이스, 스타차트, 평행좌표계, 다차원척도법
공간 시각화 지도 매핑

 

2) 시간 시각화

- 시간에 따른 데이터의 변화를 표현하는 것

  1. 막대그래프 : 데이터 값을 길이로 표현한 막대를 배치함으로써 상대적인 차이를 한눈에 알아보도록 표현하는 방법
  2. 누적막대그래프 : 막대그래프와 달리 두 개 이상의 변수를 동시에 다루는 경우 사용
  3. 묶은막대그래프 : 누적막대그래프와 같이 두 개 이상의 변수를 동시에 다루는 경우 사용
  4. 점그래프
  5. 꺾은선그래프 : 점그래프에서 점과 점 사이를 선으로 연결한 그래프로 데이터의 연속된 특성을 표현
  6. 계단그래프 : 변화가 생길 때까지 일정한 선을 유지하다가 다음 값으로 바뀌는 지점에서 급격하게 변화하는 것
  7. 추세선 : 데이터 값의 즉각적인 변화보다는 변화하는 경향성을 보여주는 직선 또는 곡선

 

3) 분포 시각화

- 데이터의 분포를 시각적으로 표현하는 기법

  1. 히스토그램
  2. 원그래프(파이 차트) : 하나의 원을 구성하는 데이터의 비율에 따라 조각으로 나누어서 데이터의 분포를 표현
  3. 도넛 차트 : 막대그래프를 누적하고 도넛 모양으로 만든 형태, 원그래프가 면적으로 분포비율을 표현하는데 반해 도넛차트는 면적이 아닌 길이로 데이터 값의 정도를 표현
  4. 트리맵 : 전체 데이터를 표현하는 하나의 사각형 영역에 세부 사각형들의 크기로 데이터의 분포를 시각화하여 표현
  5. 누적연속그래프 : 시간 변화에 따른 값의 변화를 선 그래프의 영역으로 표현

트리맵 시각화 예시
누적영역차트 시각화 예시

 

4) 관계 시각화

- 데이터 사이의 관계를 시각적으로 표현하는 것

  1. 산점도 : 두 변수의 값을 2차원(또는 3차원) 좌표계를 활용하여 점으로 표시한 것
  2. 버블 차트 : x, y값의 위치를 표시하는 산점도에 점의 위치에 해당하는 제3의 변수값을 원의 크기로 표현한 그래프
  3. 히트맵 : 데이터 분포와 관계에 대한 정보를 색으로 표현한 그래프

버블차트 시각화 예시

 

5) 비교 시각화

- 하나 이상의 변수에 대해서 변수 사이의 차이와 유사성 등을 표현하는 방법

  1. 히트맵
  2. 체르노프 페이스 : 데이터 표현에 따라 달라지는 차이를 얼굴의 모양으로 나타내는 방법
  3. 스타 차트 : 하나의 공간에 각각의 변수를 표현하는 몇 개의 축을 그리고, 축에 표시된 해당 변수의 값들을 연결하여 별 모양으로 표현하는 그래프
  4. 평행 좌표계
  5. 다차원척도법 : 모든 변수를 비교해서 비슷한 대상을 그래프 상에 가깝게 배치하는 방법
체르노프 페이스 스타차트 다차원척도법

 

 

6) 공간 시각화

= 장소나 지역에 따른 데이터의 분포를 표현하는 것

  1. 단계 구분도 : 여러 지역에 걸친 정량 정보를 나타낼 때, 데이터가 분포된 지역별로 색을 다르게 칠한 지도
  2. 카토그램 : 데이터 값의 변화에 따라 지도의 면적을 인위적으로 왜곡하여 데이터 값에 대한 직관적인 이해가 가능하도록 한 다이어그램
단계구분도 카토그램

 

 

 

참고 : 이기적 빅데이터분석기사 필기 교재

TAGS.

Comments