[이기적] 빅데이터 개요와 특징 정리 (3V·5V / 데이터 유형 / 데이터 웨어하우스 / 데이터 사이언스)

2026. 3. 5. 22:43Certifications/빅데이터분석기사 필기

1️⃣ 데이터의 이해

✅ 데이터(Data)의 정의

  • 현실 세계에서 관찰하거나 측정하여 수집한 사실
  • 추론과 의사결정의 근거가 되는 값

✅ 특징

  • 단순한 객체로도 가치가 있지만 다른 데이터와의 관계 속에서 더 큰 가치 발생
  • 객관적인 사실을 나타냄
  • 추론·예측·의사결정의 근거

✅ 데이터의 구분

종류 형태 예시
정량적 데이터
(Quantitative Data)
숫자로 표현되는 데이터
통계 분석 및 수치 계산 가능
100km/h, 2024년, 매출 100억
정성적 데이터
(Qualitative Data)
문자나 텍스트 형태의 데이터
의미 해석 중심 분석
고객 리뷰, 설문 응답, 기사

2️⃣ 데이터 유형

데이터 유형 특징 예시
정형 데이터
(Structured Data)
고정된 형식과 구조를 가진 데이터
행(Row)과 열(Column) 구조로 저장
DB 테이블, 엑셀, ERP 데이터
반정형 데이터
(Semi-structured Data)
일정한 구조는 있으나
완전히 정형화되지 않은 데이터
JSON, XML, HTML
비정형 데이터
(Unstructured Data)
구조가 정해져 있지 않은 데이터 이미지, 영상, 텍스트, SNS

3️⃣ 데이터 → 정보 → 지식 → 지혜 (DIKW)

  • 데이터는 '데이터 → 정보 → 지식 → 지혜' 순으로 발전함
단계 의미
데이터 (Data) 현실 세계에서 관찰하거나 측정하여 수집한 단순한 사실
정보 (Information) 데이터를 가공·처리하여 의미를 부여한 결과
지식 (Knowledge) 정보를 분석하여 패턴과 관계를 파악해 얻은 통찰
지혜 (Wisdom) 지식을 기반으로 상황을 판단하고 의사결정을 내리는 단계

4️⃣ 지식창조 메커니즘 (SECI 모델)

  • 노나카 이쿠지로의 지식 창조 모델

🔹 암묵지 : 무형의 지식으로 전달과 공유가 어려움
🔹 형식지 : 형상화된 유형의 지식. 전달과 공유가 쉬움

단계 지식 변환 과정
공통화 (Socialization) 암묵지 → 암묵지
표출화 (Externalization) 암묵지 → 형식지
연결화 (Combination) 형식지 → 형식지
내면화 (Internalization) 형식지 → 암묵지

📌 지식창조 메커니즘 = 공·표·연·내


5️⃣ 데이터베이스

✅ 데이터베이스 정의

  • 체계적으로 저장된 데이터 집합
  • 검색·저장·관리 가능

✅ DBMS (Database Management System)

🔹 역할

  • 데이터 저장
  • 데이터 관리
  • 데이터 공유

✅ 데이터베이스 특징

특징 설명
통합 데이터 여러 데이터가 통합되어 저장되며 중복이 최소화
저장 데이터 컴퓨터 저장장치에 저장되어 관리됨
공유 데이터 여러 사용자가 동시에 접근하여 공동으로 사용 가능
변화 데이터 데이터가 지속적으로 갱신되고 변경됨

6️⃣ OLTP vs OLAP

🔹 OLTP (Online Transaction Processing)

  • 은행 이체, 주문, 댓글 작성 등 소규모의 실시간 트랜잭션을 수많은 사용자가 동시에 빠르고 정확하게 처리하는 데이터베이스 운영 방식

🔹 OLAP (OnLine Analytical Processing)

  • 최종 사용자가 대규모 데이터 웨어하우스(DW) 내의 다차원 정보에 직접 접근하여, 다양한 비즈니스 관점에서 데이터를 대화식으로 분석하고 의사결정을 지원하는 기술
구분 OLTP OLAP
목적 트랜잭션 처리 데이터 분석
데이터 현재 데이터 과거 데이터
처리 방식 실시간 처리 분석 중심 처리
예시 은행 시스템, 쇼핑몰 주문 처리 BI 시스템, 데이터 분석

7️⃣ 데이터 웨어하우스 (DW)

✅ 데이터 웨어하우스

  • 의사결정을 위해 데이터를 통합 저장하는 시스템
특성 설명
주제 지향성 특정 주제를 중심으로 데이터를 구성
통합성 여러 시스템의 데이터를 통합하여 저장
시계열성 시간 흐름에 따른 데이터를 저장
비휘발성 데이터 수정이나 삭제가 거의 없음

✅ DW 구성요소

구성 요소 설명
ETL 데이터 추출(Extract) · 변환(Transform) · 적재(Load)
ODS 운영 데이터 저장소 (Operational Data Store)
OLAP 다차원 데이터 분석 처리
데이터 마이닝 데이터 패턴 및 규칙 발견

8️⃣ 빅데이터 개념

✅ 빅데이터 정의

  • 기존 데이터 처리 방식으로 처리하기 어려운 대규모 데이터

✅ 특징

  • 다양한 데이터
  • 빠른 생성
  • 대용량

9️⃣ 빅데이터 특징

✅ 3V

요소 설명
Volume 데이터의
Variety 다양한 데이터 유형
Velocity 데이터 처리 속도

✅ 5V

요소 설명
Volume 데이터의
Variety 다양한 데이터 유형
Velocity 데이터 처리 속도
Veracity 데이터의 신뢰성
Value 데이터가 가지는 가치

🔟 빅데이터 활용 기술

기술 설명
데이터 마이닝 데이터에서 패턴과 규칙을 발견하는 분석 기술
기계학습 데이터를 기반으로 스스로 학습하는 알고리즘
감성 분석 텍스트 데이터의 감정이나 의견을 분석
연관 분석 항목 간 연관 관계를 분석
유형 분석 데이터의 유사성을 기준으로 그룹화 (군집 분석)

📊 시험 포인트 정리

🔥 1. 빅데이터 특징

  • 3V : Volume, Variety, Velocity
  • 5V : Volume, Variety, Velocity, Veracity, Value

🔥 2. 데이터 유형

유형
정형 RDB, 테이블
반정형 JSON, XML
비정형 영상, 이미지

🔥 3. DW 특징

  • 주제 지향성
  • 통합성
  • 시계열성
  • 비휘발성

🔥 4. OLTP vs OLAP

OLTP OLAP
트랜잭션 처리 데이터 분석
현재 데이터 과거 데이터

🔥 5. DIKW 피라미드

Data → Information → Knowledge → Wisdom

📌 암기 핵심 요약

  • 빅데이터 특징 → 3V / 5V
  • DW 특징 → 주통시비
  • SECI → 공표연내
  • DIKW → Data → Information → Knowledge → Wisdom





2026 이기적 빅데이터분석기사 필기 기본서
(저자: 나홍석, 배원성, 이건길, 이혜영 | 출판사: 영진닷컴)

※ 본 글은 위 교재를 참고하여 학습 목적으로 재정리한 내용입니다.