[이기적] 빅데이터 개요와 특징 정리 (3V·5V / 데이터 유형 / 데이터 웨어하우스 / 데이터 사이언스)
2026. 3. 5. 22:43ㆍCertifications/빅데이터분석기사 필기
1️⃣ 데이터의 이해
✅ 데이터(Data)의 정의
- 현실 세계에서 관찰하거나 측정하여 수집한 사실
- 추론과 의사결정의 근거가 되는 값
✅ 특징
- 단순한 객체로도 가치가 있지만 다른 데이터와의 관계 속에서 더 큰 가치 발생
- 객관적인 사실을 나타냄
- 추론·예측·의사결정의 근거
✅ 데이터의 구분
| 종류 | 형태 | 예시 |
|---|---|---|
| 정량적 데이터 (Quantitative Data) |
숫자로 표현되는 데이터 통계 분석 및 수치 계산 가능 |
100km/h, 2024년, 매출 100억 |
| 정성적 데이터 (Qualitative Data) |
문자나 텍스트 형태의 데이터 의미 해석 중심 분석 |
고객 리뷰, 설문 응답, 기사 |
2️⃣ 데이터 유형
| 데이터 유형 | 특징 | 예시 |
|---|---|---|
| 정형 데이터 (Structured Data) |
고정된 형식과 구조를 가진 데이터 행(Row)과 열(Column) 구조로 저장 |
DB 테이블, 엑셀, ERP 데이터 |
| 반정형 데이터 (Semi-structured Data) |
일정한 구조는 있으나 완전히 정형화되지 않은 데이터 |
JSON, XML, HTML |
| 비정형 데이터 (Unstructured Data) |
구조가 정해져 있지 않은 데이터 | 이미지, 영상, 텍스트, SNS |
3️⃣ 데이터 → 정보 → 지식 → 지혜 (DIKW)
- 데이터는 '데이터 → 정보 → 지식 → 지혜' 순으로 발전함
| 단계 | 의미 |
|---|---|
| 데이터 (Data) | 현실 세계에서 관찰하거나 측정하여 수집한 단순한 사실 |
| 정보 (Information) | 데이터를 가공·처리하여 의미를 부여한 결과 |
| 지식 (Knowledge) | 정보를 분석하여 패턴과 관계를 파악해 얻은 통찰 |
| 지혜 (Wisdom) | 지식을 기반으로 상황을 판단하고 의사결정을 내리는 단계 |
4️⃣ 지식창조 메커니즘 (SECI 모델)
- 노나카 이쿠지로의 지식 창조 모델
🔹 암묵지 : 무형의 지식으로 전달과 공유가 어려움
🔹 형식지 : 형상화된 유형의 지식. 전달과 공유가 쉬움

| 단계 | 지식 변환 과정 |
|---|---|
| 공통화 (Socialization) | 암묵지 → 암묵지 |
| 표출화 (Externalization) | 암묵지 → 형식지 |
| 연결화 (Combination) | 형식지 → 형식지 |
| 내면화 (Internalization) | 형식지 → 암묵지 |
📌 지식창조 메커니즘 = 공·표·연·내
5️⃣ 데이터베이스
✅ 데이터베이스 정의
- 체계적으로 저장된 데이터 집합
- 검색·저장·관리 가능
✅ DBMS (Database Management System)
🔹 역할
- 데이터 저장
- 데이터 관리
- 데이터 공유
✅ 데이터베이스 특징
| 특징 | 설명 |
|---|---|
| 통합 데이터 | 여러 데이터가 통합되어 저장되며 중복이 최소화됨 |
| 저장 데이터 | 컴퓨터 저장장치에 저장되어 관리됨 |
| 공유 데이터 | 여러 사용자가 동시에 접근하여 공동으로 사용 가능 |
| 변화 데이터 | 데이터가 지속적으로 갱신되고 변경됨 |
6️⃣ OLTP vs OLAP
🔹 OLTP (Online Transaction Processing)
- 은행 이체, 주문, 댓글 작성 등 소규모의 실시간 트랜잭션을 수많은 사용자가 동시에 빠르고 정확하게 처리하는 데이터베이스 운영 방식
🔹 OLAP (OnLine Analytical Processing)
- 최종 사용자가 대규모 데이터 웨어하우스(DW) 내의 다차원 정보에 직접 접근하여, 다양한 비즈니스 관점에서 데이터를 대화식으로 분석하고 의사결정을 지원하는 기술
| 구분 | OLTP | OLAP |
|---|---|---|
| 목적 | 트랜잭션 처리 | 데이터 분석 |
| 데이터 | 현재 데이터 | 과거 데이터 |
| 처리 방식 | 실시간 처리 | 분석 중심 처리 |
| 예시 | 은행 시스템, 쇼핑몰 주문 처리 | BI 시스템, 데이터 분석 |
7️⃣ 데이터 웨어하우스 (DW)
✅ 데이터 웨어하우스
- 의사결정을 위해 데이터를 통합 저장하는 시스템
| 특성 | 설명 |
|---|---|
| 주제 지향성 | 특정 주제를 중심으로 데이터를 구성 |
| 통합성 | 여러 시스템의 데이터를 통합하여 저장 |
| 시계열성 | 시간 흐름에 따른 데이터를 저장 |
| 비휘발성 | 데이터 수정이나 삭제가 거의 없음 |
✅ DW 구성요소
| 구성 요소 | 설명 |
|---|---|
| ETL | 데이터 추출(Extract) · 변환(Transform) · 적재(Load) |
| ODS | 운영 데이터 저장소 (Operational Data Store) |
| OLAP | 다차원 데이터 분석 처리 |
| 데이터 마이닝 | 데이터 패턴 및 규칙 발견 |
8️⃣ 빅데이터 개념
✅ 빅데이터 정의
- 기존 데이터 처리 방식으로 처리하기 어려운 대규모 데이터
✅ 특징
- 다양한 데이터
- 빠른 생성
- 대용량
9️⃣ 빅데이터 특징
✅ 3V
| 요소 | 설명 |
|---|---|
| Volume | 데이터의 양 |
| Variety | 다양한 데이터 유형 |
| Velocity | 데이터 처리 속도 |
✅ 5V
| 요소 | 설명 |
|---|---|
| Volume | 데이터의 양 |
| Variety | 다양한 데이터 유형 |
| Velocity | 데이터 처리 속도 |
| Veracity | 데이터의 신뢰성 |
| Value | 데이터가 가지는 가치 |
🔟 빅데이터 활용 기술
| 기술 | 설명 |
|---|---|
| 데이터 마이닝 | 데이터에서 패턴과 규칙을 발견하는 분석 기술 |
| 기계학습 | 데이터를 기반으로 스스로 학습하는 알고리즘 |
| 감성 분석 | 텍스트 데이터의 감정이나 의견을 분석 |
| 연관 분석 | 항목 간 연관 관계를 분석 |
| 유형 분석 | 데이터의 유사성을 기준으로 그룹화 (군집 분석) |
📊 시험 포인트 정리
🔥 1. 빅데이터 특징
- 3V : Volume, Variety, Velocity
- 5V : Volume, Variety, Velocity, Veracity, Value
🔥 2. 데이터 유형
| 유형 | 예 |
|---|---|
| 정형 | RDB, 테이블 |
| 반정형 | JSON, XML |
| 비정형 | 영상, 이미지 |
🔥 3. DW 특징
- 주제 지향성
- 통합성
- 시계열성
- 비휘발성
🔥 4. OLTP vs OLAP
| OLTP | OLAP |
|---|---|
| 트랜잭션 처리 | 데이터 분석 |
| 현재 데이터 | 과거 데이터 |
🔥 5. DIKW 피라미드
Data → Information → Knowledge → Wisdom
📌 암기 핵심 요약
- 빅데이터 특징 → 3V / 5V
- DW 특징 → 주통시비
- SECI → 공표연내
- DIKW → Data → Information → Knowledge → Wisdom

2026 이기적 빅데이터분석기사 필기 기본서
(저자: 나홍석, 배원성, 이건길, 이혜영 | 출판사: 영진닷컴)
※ 본 글은 위 교재를 참고하여 학습 목적으로 재정리한 내용입니다.
'Certifications > 빅데이터분석기사 필기' 카테고리의 다른 글
| [이기적] 데이터 전처리 개요 정리 (데이터 정제 / 결측값 처리 / 이상치 탐지) (1) | 2026.03.08 |
|---|---|
| [이기적] 데이터 분석 절차 정리 (데이터 분석 기획 / 분석 문제 정의 / Top-Down / Bottom-Up / 분석 준비도 / 분석 성숙도) (0) | 2026.03.07 |
| [이기적] CRISP-DM 분석 방법론 정리 (KDD / SEMMA 비교) (0) | 2026.03.07 |
| [이기적] 빅데이터 플랫폼 구조 정리 (플랫폼 계층 구조 / 플랫폼 개념) (0) | 2026.03.06 |
| [이기적] 빅데이터 3V·5V 특징 정리 (Volume·Variety·Velocity / Veracity·Value) (0) | 2026.03.05 |