01. ν†΅κ³„ν•™μ΄λž€?

  • 데이터 μˆ˜μ§‘, 정리, 뢄석, 해석 β†’ κ²°κ³Ό μ œμ‹œν•˜λŠ” ν•™λ¬Έ
  • μ£Όμ–΄μ§„ 자료λ₯Ό ν† λŒ€λ‘œ 보편 νƒ€λ‹Ήν•œ 이둠을 μΆ”λ‘ ν•΄λ‚΄λŠ” ν•™λ¬Έ

Note

자료의 μˆ˜μ§‘κ³Όμ •μ„ 섀계 & 자료λ₯Ό μš”μ•½ν•˜κ³  해석 β†’ κ²°λ‘  λ„μΆœ & μΌλ°˜ν™”ν•˜λŠ” 전체적인 원리와 방법둠 제곡

02. 자료/데이터 뢄석 단계

  • 1단계 : 자료 μˆ˜μ§‘ (Data Engineering)
  • 2단계 : 자료 해석 (데이터 탐색 κ³Όμ • - EDA)
  • 3단계 : μžλ£Œλ‘œλΆ€ν„° μ˜¬λ°”λ₯Έ κ²°λ‘  λ„μΆœ

03. Statistics

a. Descriptive Statistics (기술 톡계)

  • μ£Όμ–΄μ§„ 데이터λ₯Ό μš”μ•½ν•˜κ³  μ„€λͺ…ν•˜λŠ” 데 쀑점
  • λ‹¨μˆœνžˆ ν˜„μž¬ 데이터λ₯Ό μ„€λͺ…

b. Inferential Statistics (좔리 톡계)

  • ν‘œλ³Έ 데이터λ₯Ό 기반으둜 λͺ¨μ§‘단에 λŒ€ν•œ κ²°λ‘  μΆ”λ‘ 
  • Population : λͺ¨μ§‘단
  • Sample : ν‘œλ³Έ

04. ν†΅κ³„ν•™μ˜ λͺ©ν‘œ

  • 톡계학은 자료의 일뢀 (ν‘œλ³Έ)λ§Œμ„ μ΄μš©ν•˜μ—¬ λͺ¨μ§‘단 전체에 λŒ€ν•œ 좔둠을 ν•˜λ―€λ‘œ 항상 였λ₯˜μ˜ κ°€λŠ₯성이 쑴재
  • Random Sampling을 톡해 였λ₯˜λ₯Ό μ΅œμ†Œν™”
  • λ”°λΌμ„œ ν‘œλ³Έ μΆ”μΆœμ˜ κ³Όμ •κ³Ό λ²”μœ„λ₯Ό μ„€κ³„ν•˜κ³  ν‘œλ³Έμ— ν¬ν•¨λ˜μ–΄ μžˆλŠ” 정보λ₯Ό λΆ„μ„ν•˜μ—¬ λͺ¨μ§‘λ‹¨μ˜ 정보λ₯Ό μΆ”μΆœν•˜λŠ” 것이 ν†΅κ³„ν•™μ˜ 주된 λͺ©ν‘œ

05. λΉ„νŒμ  사고

  • 논리적 함정, μž‘μ€ ν‘œλ³Έ, non-random ν‘œλ³Έμ— μ˜ν•œ κ²°λ‘ 
  • 잘λͺ»λœ ν‘œλ³Έ μΆ”μΆœ, μ—°κ΄€μ„±κ³Ό 인과관계 였λ₯˜, 집단 β†’ 개인으둜 μΌλ°˜ν™” 였λ₯˜
  • bias, μœ μ˜μ„± (얻은 κ²°κ³Όκ°€ μš°μ—°μ΄ μ•„λ‹ˆλΌλŠ” 증거)κ³Ό μ€‘μš”μ„±
    • ν†΅κ³„μ μœΌλ‘œ μœ μ˜ν•˜λ‚˜ μ‹€μ œλ‘œ 큰 λ³€ν™”λŠ” μ—†λŠ” 경우
  • μœ„μ™€ 같은 μ£Όμ˜μ μ— λΉ„νŒμ  사고가 ν•„μš”ν•¨