빅데이터분석기사 필기 1일차 -2

Part01 빅데이터 분석 기획

Chapter01 빅데이터의 이해

Section01 빅데이터 개요 및 활용

 

1) 데이터베이스의 정의

  • 개별적으로 접근할 수 있는 독립된 저작물, 데이터 또는 기타 소재의 수집물
  • 복수 이용자의 요구에 대응해서 데이터를 받아들이고 저장, 공급하기 위하여 일정한 구조에 따라서 편성된 데이터의 집합
  • 다수의 콘텐츠를 정보 처리 및 정보통신 기기에 의하여 체계적으로 수집, 축적하여 다양한 용도와 방법으로 이용할 수 있도록 정리한 정보의 집합

▶ 데이터베이스 관리 시스템의 종류

종류 설명
관계형 DBMS 데이터로 열과 행을 이루는 테이블로 표현하는 모델
객체지향 DBMS 정보를 객체 형태로 표현하는 모델
네트워크 DBMS 그래프 구조를 기반으로 하는 모델
계층형 DBMS 트리 구조를 기반으로 하는 모델

● SQL(Structured Query Language)

- 데이터베이스에 접근할 때 사용하는 언어

- 단순한 질의 기능뿐만 아니라 데이터 정의와 조작 기능을 갖춤

- 테이블 단위로 연산을 수행하며 초보자들도 비교적 쉽게 사용 가능

 

▶ 데이터베이스의 장단점

장점 단점
● 데이터 중복 최소화
● 실시간 접근 가능
● 데이터 보안 강화
● 논리적 및 물리적 독립성 제공
● 데이터 일관성 제공
● 데이터 무결성 보장
● 데이터 공유 용이
● 구축과 유지에 따른 비용 발생
● 백업과 복구 등 관리 필요





 

● OLTP(OnLine Transavtion Processing)

- 호스트 컴퓨터와 온라인으로 접속된 단말 간 처리 형태의 하나로 데이터베이스의 데이터를 수시로 갱신하는 프로세싱

 

 

● OLAP(OnLine Analytical Processing)

- 정보 위주의 분석 처리

 

 

● 데이터 웨어하우스(DW : Data Warehouse)

- 사용자의 의사결정에 도움을 주기 위하여 기간시스템의 데이터베이스에 축적된 데이터를 공통의 형식으로 변환해서 관리하는 데이터베이스

 

 

▶ 데이터 웨어하우스의 특징

  • 주제지향성 : 고객, 제품 등과 같은 중요한 주제를 중심으로 함
  • 통합성 : 일관된 형태로 변환되며, 전사적인 관점에서 통합
  • 시계열성 : 일정 기간 동안 시점별로 이어짐
  • 비휘발성 : 일괄 처리 작업에 의한 갱신 이외에는 변경이 수행되지 않음

 

● 빅데이터란

- 기존 데이터보다 너무 방대하여 기존의 방법이나 도구로 수집 / 저장 / 분석 등이 어려운 정형 및 비정형 데이터

 

 

▶ 빅데이터의 등장으로 인한 변화

  • 데이터 처리 시점이 사전 처리에서 사후 처리로 이동
  • 데이터 처리 범주가 표본조사에서 전수조사로 확대
  • 데이터의 가치 판단 기준이 질보다 양으로 중요도가 달라짐
  • 데이터를 분석하는 방향이 이론적 인과관계 중심에서 단순한 상관관계로 변화되는 경향이 있음

▶ 빅데이터의 특징

◎ 3V

  1. 규모(Volume)
  2. 유형(Variety)
  3. 속도(Velocity)

2) 데이터 산업의 진화

데이터 산업의 진화(데이터 산업 백서)

 

 

 

참고도서 : 이기적 빅데이터분석기사 필기

TAGS.

Comments