빅데이터분석기사 필기 4일차 -1
Part01 빅데이터 분석 기획
Chapter03 데이터 수집 및 저장 계획
Section01 데이터 적재 및 저장
1) 데이터 수집 및 적재 연계
- 데이터 수집 도구를 이용한 데이터 적재
- NoSQL DBMS가 제공하는 도구를 이용한 데이터 적재
- 관계형 DBMS의 데이터를 NoSQL DBMS에서 적재
2) 빅데이터 저장시스템
- 대용량 데이터 집합을 저장하고 관리하는 시스템으로 사용자에게 데이터 제공 신뢰성과 가용성을 보장하는 시스템
- 파일 시스템 저장 방식 : 분산 파일의 형태로 저장하는 방식(Apache HDFS, 구글의 GFS)
- 데이터베이스 저장방식 : 전통적인 관계형 DB 시스템을 이용하거나 NoSQL 데이터베이스 시스템을 이용하는 방식 - 수평적 확장성, 데이터 복제, 간편한 API 제공, 일관성 보장 등의 장점
▶ 데이터 모델에 따른 NoSQL 데이터베이스 분류
- key-value 데이터베이스
- column-oriented 데이터베이스
- document 데이터베이스
3) 빅데이터 저장 시스템 선정을 위한 분석
- 데이터 모델, 확장성, 트랜잭션 일관성, 질의 지원, 접근성
4) 대용량 실시간 서비스 데이터
- 실시간으로 처리해야 하는 데이터를 스트리밍 데이터라 하는데 대용량의 특성과 무중단 서비스를 보장하는 저장 체계를 구축해야 함
- 실시간 데이터 처리를 위해 사용되는 시스템으로 스파크, 스톰 등이 있으며 배치 기반의 대용량 데이터 처리에 특화된 하둡 시스템보다 실시간 대용량 데이터 처리에 특화되어 있음
참고도서 : 이기적 빅데이터분석기사 필기
'빅데이터' 카테고리의 다른 글
빅데이터분석기사 필기 5일차 (0) | 2021.03.15 |
---|---|
빅데이터분석기사 필기 4일차 -2 (0) | 2021.03.12 |
빅데이터분석기사 필기 3일차 -2 (0) | 2021.03.11 |
빅데이터분석기사 필기 3일차 -1 (0) | 2021.03.11 |
빅데이터분석기사 필기 2일차 -3 (0) | 2021.03.10 |
TAGS.