Eda(2)
-
[이기적] 관계 시각화 정리 (Scatter Plot · Bubble Chart · Heat Map)
1️⃣ 관계 시각화(Relationship Visualization)✅ 정의데이터 변수 간 상관관계 또는 패턴을 시각적으로 표현하는 방법데이터셋에 변수가 2개 이상 존재할 때 변수 간 관계 분석에 사용데이터 분석에서 관계 구조 탐색(EDA) 단계에서 매우 중요🎯 포인트변수 간 상관관계 표현관계 구조 탐색대표 도구 → 산점도, 버블차트, 히트맵2️⃣ 산점도(Scatter Plot)✅ 개념두 변수 값을 2차원 좌표 평면에 점으로 표시하는 그래프점들의 분포를 통해 변수 간 관계 패턴을 확인할 수 있음✅ 특징두 변수 관계 시각화의 가장 기본적인 방법점 분포를 통해 상관관계 방향(양·음) 및 강도 파악추세선을 추가하면 관계 경향 분석 가능✅ 상관관계 유형 유형 ..
2026.03.14 -
[이기적] 데이터 탐색(EDA) 개요 정리 (EDA / 산포도 / 히스토그램 / 박스플롯)
1️⃣ 데이터 탐색의 개요✅ 탐색적 데이터 분석 (EDA)데이터를 다양한 방법으로 관찰하고 이해하는 과정본격적인 모델링 이전에 데이터의 구조와 특성 파악🔹 특징데이터의 분포 확인이상치 탐지변수 간 관계 파악데이터 품질 문제 발견🎯 포인트EDA = 데이터를 이해하는 분석 초기 단계✅ 데이터 탐색의 필요성EDA는 데이터가 표현하는 현상을 이해하고 문제 해결 방향을 찾기 위해 수행됨🔹 목적데이터 분포 및 값 검토데이터의 잠재적 문제 발견분석 방향 설정🔹 효과문제 해결 방향 도출새로운 패턴 발견분석 가설 생성2️⃣ 데이터 탐색 절차✅ 분석 절차분석 목적 및 변수 확인 데이터 품질 확인 데이터 분포 확인 변수 간 관계 분석 이상치 탐지3️⃣ 기초 통계량EDA에서는 데이터 특성을 이해하기 위해 기초 ..
2026.03.09