1. μ‚¬μ΄ν‚·λŸ°μ€ 맀우 λ§Žμ€ λ¨Έμ‹ λŸ¬λ‹ μ•Œκ³ λ¦¬μ¦˜μ„ μ œκ³΅ν•  뿐만 μ•„λ‹ˆλΌ, 쉽고 직관적인 API ν”„λ ˆμž„μ›Œν¬, νŽΈλ¦¬ν•˜κ³  λ‹€μ–‘ν•œ λͺ¨λ“ˆ 지원 λ“±μœΌλ‘œ 파이썬 κ³„μ—΄μ˜ λŒ€ν‘œμ μΈ λ¨Έμ‹ λŸ¬λ‹ νŒ¨ν‚€μ§€

  2. λ¨Έμ‹ λŸ¬λ‹ μ• ν”Œλ¦¬μΌ€μ΄μ…˜μ€ λ°μ΄ν„°μ˜ 가곡 및 λ³€ν™˜ κ³Όμ •μ˜ μ „μ²˜λ¦¬ μž‘μ—…, 데이터λ₯Ό ν•™μŠ΅ 데이터와 ν…ŒμŠ€νŠΈ λ°μ΄ν„°λ‘œ λΆ„λ¦¬ν•˜λŠ” 데이터 μ„ΈνŠΈ 뢄리 μž‘μ—…μ„ 거친 후에 ν•™μŠ΅ 데이터λ₯Ό 기반으둜 λ¨Έμ‹ λŸ¬λ‹ μ•Œκ³ λ¦¬μ¦˜μ„ μ μš©ν•΄ λͺ¨λΈμ„ ν•™μŠ΅

    • 그리고 ν•™μŠ΅λœ λͺ¨λΈμ„ 기반으둜 ν…ŒμŠ€νŠΈ 데이터에 λŒ€ν•œ μ˜ˆμΈ‘μ„ μˆ˜ν–‰ν•˜κ³ , μ΄λ ‡κ²Œ 예츑된 결괏값을 μ‹€μ œ 결괏값과 비ꡐ해 λ¨Έμ‹ λŸ¬λ‹ λͺ¨λΈμ— λŒ€ν•œ 평가λ₯Ό μˆ˜ν–‰ν•˜λŠ” λ°©μ‹μœΌλ‘œ ꡬ성
  3. 데이터 μ „μ²˜λ¦¬λŠ” 였λ₯˜ λ°μ΄ν„°μ˜ λ³΄μ •μ΄λ‚˜ 결손값(Null) 처리 λ“±μ˜ λ‹€μ–‘ν•œ 데이터 ν΄λ Œμ§• μž‘μ—…, λ ˆμ΄λΈ” μΈμ½”λ”©μ΄λ‚˜ 원-ν•« 인코딩과 같은 인코딩 μž‘μ—…, 그리고 λ°μ΄ν„°μ˜ μŠ€μΌ€μΌλ§/μ •κ·œν™” μž‘μ—… λ“±μœΌλ‘œ λ¨Έμ‹ λŸ¬λ‹ μ•Œκ³ λ¦¬μ¦˜μ΄ 졜적으둜 μˆ˜ν–‰λ  수 있게 데이터λ₯Ό 사전 μ²˜λ¦¬ν•˜λŠ” 것

  4. λ¨Έμ‹ λŸ¬λ‹ λͺ¨λΈμ€ ν•™μŠ΅ 데이터 μ„ΈνŠΈλ‘œ ν•™μŠ΅ν•œ λ’€ λ°˜λ“œμ‹œ λ³„λ„μ˜ ν…ŒμŠ€νŠΈ 데이터 μ„ΈνŠΈλ‘œ ν‰κ°€λ˜μ–΄μ•Ό 함

    • λ˜ν•œ ν…ŒμŠ€νŠΈ λ°μ΄ν„°μ˜ 건수 λΆ€μ‘±μ΄λ‚˜ κ³ μ •λœ ν…ŒμŠ€νŠΈ 데이터 μ„ΈνŠΈλ₯Ό μ΄μš©ν•œ 반볡적인 λͺ¨λΈμœΌ ν•™μŠ΅κ³Ό ν‰κ°€λŠ” ν•΄λ‹Ή ν…ŒμŠ€νŠΈ 데이터 μ„ΈνŠΈμ—λ§Œ 치우친 λΉˆμ•½ν•œ λ¨Έμ‹ λŸ¬λ‹ λͺ¨λΈμ„ λ§Œλ“€ κ°€λŠ₯성이 λ†’μŒ
    • 이λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•΄ ν•™μŠ΅ 데이터 μ„ΈνŠΈλ₯Ό ν•™μŠ΅ 데이터와 검증 λ°μ΄ν„°λ‘œ κ΅¬μ„±λœ μ—¬λŸ¬ 개의 fold μ„ΈνŠΈλ‘œ 뢄리해 ꡐ차 검증을 μˆ˜ν–‰ν•  수 있음
    • μ‚¬μ΄ν‚·λŸ°μ€ μ΄λŸ¬ν•œ ꡐ차 검증을 μ§€μ›ν•˜κΈ° μœ„ν•΄ KFold, StratifiedKFold, cross_val_score()λ“±μ˜ λ‹€μ–‘ν•œ ν΄λž˜μŠ€μ™€ ν•¨μˆ˜λ₯Ό 제곡
    • λ¨Έμ‹ λŸ¬λ‹ λͺ¨λΈμ˜ 졜적의 ν•˜μ΄νΌ νŒŒλΌλ―Έν„°λ₯Ό ꡐ차 검증을 톡해 μΆ”μΆœν•˜κΈ° μœ„ν•΄ GridSearchCVλ₯Ό 제곡

λ‹€μŒ μž₯μ—μ„œλŠ” 본격적으둜 λ¨Έμ‹ λŸ¬λ‹ μ§€λ„ν•™μŠ΅μ˜ λŒ€ν‘œμ μΈ ν•œ 좕인 λΆ„λ₯˜(Classification)λ₯Ό ν•™μŠ΅ν•˜κΈ° 전에 λ¨Όμ € λΆ„λ₯˜μ˜ 예츑 μ„±λŠ₯을 ν‰κ°€ν•˜λŠ” λ‹€μ–‘ν•œ 방법을 확인