빅데이터분석기사 필기 1일차 -1

Part01 빅데이터 분석 기획

Chapter01 빅데이터의 이해

Section01 빅데이터 개요 및 활용

1) 데이터의 정의

- 추론과 추정의 근거를 이루는 사실

- 현실 세계에서 관찰하거나 측정하여 수집한 사실

 

2) 데이터의 특징

- 단순한 객체로도 가치가 있으며 다른 객체와의 상호관계 속에서 더 큰 가치를 갖는다.

- 객관적 사실이라는 존재적 특성을 갖는다.

 

3) 데이터의 구분

① 정량적 데이터 : 주로 숫자로 이루어진 데이터

② 정성적 데이터 : 문자와 같은 텍스트로 구성되며 함축적 의미를 지니고 있는 데이터

 

▶ 정량적 데이터와 정성적 데이터의 비교

  정량적 데이터 정성적 데이터
유형 정형 데이터, 반정형 데이터 비정형 데이터
특징 여러 요소의 결합으로 의미 부여 객체 하나가 함축된 의미 내포
관점 주로 객관적 내용 주로 주관적 내용
구성 수치나 기호 등 문자나 언어 등
형태 데이터베이스, 스프레드시트 등 웹 로그, 텍스트 파일 등
위치 DBMS, 로컬 시스템 등 내부 웹사이트, 모바일 플랫폼 등 외부
분석 통계 분석 시 용이 통계 분석 시 어려움

 

4) 데이터의 유형

① 정형 데이터 : 정해진 형식과 구조에 맞게 저장되도록 구성된 데이터이며, 연산이 가능

② 반정형 데이터 : 데이터의 형식과 구조가 비교적 유연하고, 스키마 정보를 데이터와 함께 제공하는 파일 형식의 데이터이며, 연산이 불가능    ex) JSON, XML, RDF, HTML 등

③ 비정형 데이터 : 구조가 정해지지 않은 대부분의 데이터이며, 연산이 불가능    ex) 동영상, 이미지, 음성, 문서, 메일 등

 

5) 데이터의 근원에 따른 분류

① 가역 데이터 : 생산된 데이터의 원본

불가역 데이터 : 생산된 데이터의 원본으로 환원이 불가능한 데이터

 

▶ 가역 데이터와 불가역 데이터의 비교

  가역 데이터 불가역 데이터
환원성(추적성) 가능(비가공 데이터 불가능(가공 데이터
의존성 원본 데이터 그 자체 원본 데이터와 독립된 새 객체
원본과의 관계 1대1의 관계 1대N, N대1 또는 M대N의 관계
처리과정 탐색 결합
활용분야 데이터 마트, 데이터 웨어 하우스 데이터 전처리, 프로파일 구성

 

6) 데이터의 기능

① 암묵지 : 어떠한 시행착오나 다양하고 오랜 경험을 통해 개인에게 체계화되어 있으며 전달과 공유가 어려움

② 형식지 : 형상화된 유형의 지식으로 그 전달과 공유가 쉽다.

 

7) 지식창조 매커니즘 (☆암묵지와 형식지 간 상호작용) 

① 공통화 : 서로의 경험이나 인식을 공유하며 한 차원 높은 암묵지로 발전시킴

② 표출화 : 암묵지가 구체화되어 외부로 표현됨

③ 연결화 : 형식지를 재분류하여 체계화함

④ 내면화 : 전달받은 형식지를 다시 개인의 것으로 만든다.

공통화 표출화
내면화 연결화

 

8) 데이터, 정보, 지식, 지혜

지식의 피라미드(가치창출 프로세스)

 

 

참고도서 : 이기적 빅데이터분석기사 필기

TAGS.

Comments