Contents

EDA에 λŒ€ν•˜μ—¬

   Jul 6, 2024     1 min read

EDA에 λŒ€ν•˜μ—¬ μ•Œμ•„λ³Έ κΈ€μž…λ‹ˆλ‹€.

μ•ˆλ…•ν•˜μ„Έμš”!

μ˜€λŠ˜μ€ EDA에 λŒ€ν•˜μ—¬ μ•Œμ•„λ³΄κ² μŠ΅λ‹ˆλ‹€.

탐색적 데이터 뢄석(Exploratory Data Analysis, EDA)은 데이터λ₯Ό νƒμƒ‰ν•˜κ³  μ΄ν•΄ν•˜κΈ° μœ„ν•œ κ³Όμ •μœΌλ‘œ, 주둜 μ‹œκ°ν™” 및 톡계적 도ꡬλ₯Ό μ‚¬μš©ν•˜μ—¬ λ°μ΄ν„°μ˜ νŠΉμ„±μ„ νŒŒμ•…ν•˜κ³  가섀을 μ„Έμš°λŠ” 과정을 λ§ν•©λ‹ˆλ‹€.

μ•„λž˜λŠ” EDA에 λŒ€ν•œ λ‚΄μš©μž…λ‹ˆλ‹€.

λ°μ΄ν„°μ˜ ꡬ쑰 νŒŒμ•…

EDA의 첫 λ‹¨κ³„λŠ” λ°μ΄ν„°μ˜ ꡬ쑰λ₯Ό νŒŒμ•…ν•˜λŠ” κ²ƒμž…λ‹ˆλ‹€.

λ°μ΄ν„°μ˜ λ³€μˆ˜, ν˜•μ‹, 뢄포, 결츑치, μ΄μƒμΉ˜ 등을 ν™•μΈν•˜μ—¬ λ°μ΄ν„°μ˜ νŠΉμ„±μ„ μ΄ν•΄ν•©λ‹ˆλ‹€.

μ‹œκ°ν™”λ₯Ό ν†΅ν•œ 데이터 탐색

μ‹œκ°ν™”λŠ” λ°μ΄ν„°μ˜ νŠΉμ„±μ„ νŒŒμ•…ν•˜λŠ” 데 맀우 μœ μš©ν•©λ‹ˆλ‹€.

νžˆμŠ€ν† κ·Έλž¨, λ°•μŠ€ ν”Œλ‘―, 산점도, 히트맡 λ“± λ‹€μ–‘ν•œ μ‹œκ°ν™” 기법을 ν™œμš©ν•˜μ—¬ λ°μ΄ν„°μ˜ 뢄포, 상관 관계, μ΄μƒμΉ˜ 등을 μ‹œκ°μ μœΌλ‘œ νŒŒμ•…ν•©λ‹ˆλ‹€.

기초 톡계 뢄석

λ°μ΄ν„°μ˜ 쀑심 κ²½ν–₯μ„±, λΆ„μ‚°, 상관 관계, λΉˆλ„ λ“±μ˜ 기초적인 톡계 뢄석을 톡해 λ°μ΄ν„°μ˜ νŠΉμ„±μ„ μ΄ν•΄ν•©λ‹ˆλ‹€.

κ°€μ„€ 수립

EDAλ₯Ό 톡해 λ°μ΄ν„°μ˜ νŠΉμ„±μ„ νŒŒμ•…ν•˜κ³ , 가섀을 μ„Έμ›λ‹ˆλ‹€.

이λ₯Ό 톡해 데이터에 λŒ€ν•œ 좔가적인 뢄석을 μˆ˜ν–‰ν•  수 μžˆλŠ” λ°©ν–₯을 μ œμ‹œν•©λ‹ˆλ‹€.

νŒ¨ν„΄ 및 κ²½ν–₯μ„± νŒŒμ•…

EDAλ₯Ό 톡해 λ°μ΄ν„°μ˜ νŒ¨ν„΄, κ²½ν–₯μ„±, ꡰ집화 등을 νŒŒμ•…ν•˜μ—¬ 데이터에 λ‚΄μž¬λœ νŠΉμ„±μ„ μ΄ν•΄ν•˜κ³ , 의미 μžˆλŠ” 정보λ₯Ό μΆ”μΆœν•©λ‹ˆλ‹€.

결과의 μ‹œκ°ν™” 및 해석

EDA의 κ²°κ³Όλ₯Ό μ‹œκ°ν™”ν•˜κ³  이λ₯Ό ν•΄μ„ν•˜μ—¬ 데이터에 λŒ€ν•œ 이해λ₯Ό 높이며, 좔가적인 λΆ„μ„μ΄λ‚˜ μ˜μ‚¬κ²°μ •μ— ν™œμš©ν•  수 μžˆλŠ” 톡찰을 λ„μΆœν•©λ‹ˆλ‹€.

마치며

EDAλŠ” 데이터 λΆ„μ„μ˜ 초기 λ‹¨κ³„λ‘œ, λ°μ΄ν„°μ˜ νŠΉμ„±μ„ νŒŒμ•…ν•˜κ³  가섀을 μ„Έμš°λŠ” λ“±μ˜ μž‘μ—…μ„ μˆ˜ν–‰ν•˜μ—¬, 데이터 λΆ„μ„μ˜ λ°©ν–₯을 κ²°μ •ν•˜λŠ” 데 μ€‘μš”ν•œ 역할을 ν•©λ‹ˆλ‹€.

κ°μ‚¬ν•©λ‹ˆλ‹€!