빅데이터분석기사 필기 1일차 -1
Part01 빅데이터 분석 기획
Chapter01 빅데이터의 이해
Section01 빅데이터 개요 및 활용
1) 데이터의 정의
- 추론과 추정의 근거를 이루는 사실
- 현실 세계에서 관찰하거나 측정하여 수집한 사실
2) 데이터의 특징
- 단순한 객체로도 가치가 있으며 다른 객체와의 상호관계 속에서 더 큰 가치를 갖는다.
- 객관적 사실이라는 존재적 특성을 갖는다.
3) 데이터의 구분
① 정량적 데이터 : 주로 숫자로 이루어진 데이터
② 정성적 데이터 : 문자와 같은 텍스트로 구성되며 함축적 의미를 지니고 있는 데이터
▶ 정량적 데이터와 정성적 데이터의 비교
정량적 데이터 | 정성적 데이터 | |
유형 | 정형 데이터, 반정형 데이터 | 비정형 데이터 |
특징 | 여러 요소의 결합으로 의미 부여 | 객체 하나가 함축된 의미 내포 |
관점 | 주로 객관적 내용 | 주로 주관적 내용 |
구성 | 수치나 기호 등 | 문자나 언어 등 |
형태 | 데이터베이스, 스프레드시트 등 | 웹 로그, 텍스트 파일 등 |
위치 | DBMS, 로컬 시스템 등 내부 | 웹사이트, 모바일 플랫폼 등 외부 |
분석 | 통계 분석 시 용이 | 통계 분석 시 어려움 |
4) 데이터의 유형
① 정형 데이터 : 정해진 형식과 구조에 맞게 저장되도록 구성된 데이터이며, 연산이 가능
② 반정형 데이터 : 데이터의 형식과 구조가 비교적 유연하고, 스키마 정보를 데이터와 함께 제공하는 파일 형식의 데이터이며, 연산이 불가능 ex) JSON, XML, RDF, HTML 등
③ 비정형 데이터 : 구조가 정해지지 않은 대부분의 데이터이며, 연산이 불가능 ex) 동영상, 이미지, 음성, 문서, 메일 등
5) 데이터의 근원에 따른 분류
① 가역 데이터 : 생산된 데이터의 원본
② 불가역 데이터 : 생산된 데이터의 원본으로 환원이 불가능한 데이터
▶ 가역 데이터와 불가역 데이터의 비교
가역 데이터 | 불가역 데이터 | |
환원성(추적성) | 가능(비가공 데이터 | 불가능(가공 데이터 |
의존성 | 원본 데이터 그 자체 | 원본 데이터와 독립된 새 객체 |
원본과의 관계 | 1대1의 관계 | 1대N, N대1 또는 M대N의 관계 |
처리과정 | 탐색 | 결합 |
활용분야 | 데이터 마트, 데이터 웨어 하우스 | 데이터 전처리, 프로파일 구성 |
6) 데이터의 기능
① 암묵지 : 어떠한 시행착오나 다양하고 오랜 경험을 통해 개인에게 체계화되어 있으며 전달과 공유가 어려움
② 형식지 : 형상화된 유형의 지식으로 그 전달과 공유가 쉽다.
7) 지식창조 매커니즘 (☆암묵지와 형식지 간 상호작용)
① 공통화 : 서로의 경험이나 인식을 공유하며 한 차원 높은 암묵지로 발전시킴
② 표출화 : 암묵지가 구체화되어 외부로 표현됨
③ 연결화 : 형식지를 재분류하여 체계화함
④ 내면화 : 전달받은 형식지를 다시 개인의 것으로 만든다.
공통화 | 표출화 |
내면화 | 연결화 |
8) 데이터, 정보, 지식, 지혜
참고도서 : 이기적 빅데이터분석기사 필기
'빅데이터' 카테고리의 다른 글
빅데이터분석기사 필기 3일차 -1 (0) | 2021.03.11 |
---|---|
빅데이터분석기사 필기 2일차 -3 (0) | 2021.03.10 |
빅데이터분석기사 필기 2일차 -2 (0) | 2021.03.10 |
빅데이터분석기사 필기 2일차 -1 (0) | 2021.03.10 |
빅데이터분석기사 필기 1일차 -2 (0) | 2021.03.09 |