μ΄νƒœν™
홍'story
μ΄νƒœν™
전체 방문자
였늘
μ–΄μ œ
  • λΆ„λ₯˜ 전체보기 (171)
    • TW (39)
    • AI (47)
      • μžμ—°μ–΄ 처리 (10)
      • Kaggle (2)
      • Machine Learning (26)
      • Computer Vision (0)
      • Deep Learning (0)
      • ROS2 (7)
    • Computer Science (29)
      • Data Structure (0)
      • Algorithm (18)
      • Computer Architecture (5)
      • SOLID (0)
      • System Programing (6)
    • LOLPAGO (10)
      • ν”„λ‘ νŠΈμ—”λ“œ (10)
      • λ°±μ—”λ“œ (0)
    • BAEKJOON (2)
    • React (5)
    • μ–Έμ–΄ (8)
      • C++ (8)
    • GIT (0)
    • MOGAKCO (19)
    • λ―Έκ΅­ μ—¬ν–‰κΈ° (3)
    • etc. (7)
      • Blog (2)
      • μ½œλΌν†€ (2)

λΈ”λ‘œκ·Έ 메뉴

  • ν™ˆ
  • νƒœκ·Έ
  • λ°©λͺ…둝

곡지사항

인기 κΈ€

νƒœκ·Έ

  • C++
  • computerscience
  • NLP
  • tw
  • μ•Œκ³ λ¦¬μ¦˜
  • λ°±μ€€
  • LOLPAGO
  • λ”₯λŸ¬λ‹
  • baekjoon
  • κΈ°κ³„ν•™μŠ΅
  • algorithm
  • κ²½μ‚¬ν•˜κ°•λ²•
  • pytorch
  • react
  • λ¨Έμ‹ λŸ¬λ‹
  • Ai
  • kaggle
  • computer architecture
  • ML
  • ROS2

졜근 λŒ“κΈ€

졜근 κΈ€

ν‹°μŠ€ν† λ¦¬

hELLO Β· Designed By μ •μƒμš°.
μ΄νƒœν™

홍'story

[ML] Regression(νšŒκ·€)(2) - Model Evaluation(λͺ¨λΈ 평가)
AI/Machine Learning

[ML] Regression(νšŒκ·€)(2) - Model Evaluation(λͺ¨λΈ 평가)

2022. 11. 11. 11:21

πŸ€”Regression

κ΄€μ°°λœ μ—°μ†ν˜• λ³€μˆ˜λ“€μ— λŒ€ν•΄ 두 λ³€μˆ˜ μ‚¬μ΄μ˜ λͺ¨ν˜•을 κ΅¬ν•œ λ’€ 적합도λ₯Ό μΈ‘μ •ν•΄ λ‚΄λŠ” 뢄석 λ°©λ²•μž…λ‹ˆλ‹€.

 

즉, $x$값에 따라 $y$값이 μ–΄λŠ μ •λ„λ‘œ λ³€ν™”ν•  μ§€ μ˜ˆμΈ‘ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

 

νšŒκ·€λΆ„μ„μ€ μ‹œκ°„μ— 따라 λ³€ν™”ν•˜λŠ” λ°μ΄ν„°λ‚˜ μ–΄λ–€ 영ν–₯, 가섀적 μ‹€ν—˜, 인과 κ΄€κ³„μ˜ λͺ¨λΈλ§λ“±μ˜ 톡계적 μ˜ˆμΈ‘μ— 이용될 수 μžˆμŠ΅λ‹ˆλ‹€.

 

νšŒκ·€λΆ„μ„μ€ supervised learning(yκ°€ μ‘΄μž¬ν•˜λŠ” ν•™μŠ΅)의 λŒ€ν‘œμ μΈ 뢄석 기법쀑 ν•˜λ‚˜μ΄λ©° continuousν•œ 값듀을 μ°ΎμŠ΅λ‹ˆλ‹€.

 

이번 μ‹œκ°„μ—λŠ” Regression Model의 λͺ¨λΈ 평가에 λŒ€ν•΄ μ•Œμ•„λ³΄λ„λ‘ ν•˜κ² μŠ΅λ‹ˆλ‹€.

 

λͺ¨λΈ 평가에 λŒ€ν•œ μžμ„Έν•œ λ‚΄μš©μ€ ν•œ 번 더 닀루도둝 ν•˜κ² μŠ΅λ‹ˆλ‹€.

 

 

 

 

 

 

 

 

 

 

 

πŸ”Ž Model Evaluation

λͺ¨λΈ ν‰κ°€λŠ” λ‹€μ–‘ν•œ 평가 방법을 μ‚¬μš©ν•˜μ—¬ λ¨Έμ‹  λŸ¬λ‹ λͺ¨λΈμ˜ μ„±λŠ₯κ³Ό 강점과 약점을 μ΄ν•΄ν•˜λŠ” ν”„λ‘œμ„ΈμŠ€μž…λ‹ˆλ‹€. 

 

λͺ¨λΈ ν‰κ°€λŠ” 초기 연ꡬ λ‹¨κ³„μ—μ„œ λͺ¨λΈμ˜ μœ νš¨μ„±μ„ ν‰κ°€ν•˜λŠ” 데 μ€‘μš”ν•˜λ©° λͺ¨λΈ λͺ¨λ‹ˆν„°λ§μ—μ„œλ„ 역할을 ν•©λ‹ˆλ‹€.

 

λͺ¨λΈμ΄ μƒˆ 데이터와 잘 μž‘λ™ν•˜λŠ”μ§€ μ΄ν•΄ν•˜κΈ° μœ„ν•΄ μ—¬λŸ¬ 평가 μ§€ν‘œλ₯Ό ν™œμš©ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

 

μ„ ν˜• νšŒκ·€λ₯Ό 배운 만큼 μ„ ν˜• νšŒκ·€μ— λŒ€ν•œ Model Evaluation을 μ€‘μ‹¬μœΌλ‘œ μ•Œμ•„λ³΄κ² μŠ΅λ‹ˆλ‹€.

 

 

 

 

 

 

 

 

 

 

https://www.dominodatalab.com/data-science-dictionary/model-evaluation

 

What is Model Evaluation? | Domino Data Science Dictionary

Model evaluation is the process of using different evaluation metrics to understand a machine learning model’s performance, as well as its strengths and weaknesses. Model evaluation is important to assess the efficacy of a model during initial research p

www.dominodatalab.com

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

πŸ”Ž Performance Measurements

λͺ¨λΈμ„ μΈ‘μ •ν•˜λŠ” 방법은 맀우 λ‹€μ–‘ν•©λ‹ˆλ‹€.

 

$y$와 $\hat{y}$λ₯Ό 기반으둜 차이 μΈ‘μ •ν•˜λŠ” 방법과 $R^2$ Model Evaluation 에 λŒ€ν•΄ μ•Œμ•„λ³΄κ² μŠ΅λ‹ˆλ‹€.

 

 

 

 

 

 

 

✍️ $y$와 $\hat{y}$λ₯Ό 기반으둜 차이 μΈ‘μ •ν•˜κΈ°

λŒ€λΆ€λΆ„μ˜ 방법듀은 μ‹€μ œ 츑정값인 $y$와 μ˜ˆμΈ‘κ°’μΈ $\hat{y}$μ™€μ˜ 차이λ₯Ό λΉ„κ΅ν•˜λŠ” κ²ƒμ—μ„œ μ‹œμž‘ν•©λ‹ˆλ‹€.

 

 

 

 

이λ₯Ό μ •λ¦¬ν•˜λ©΄ μ•„λž˜μ™€ 같이 λ‚˜νƒ€λ‚Ό 수 μžˆμŠ΅λ‹ˆλ‹€.

 

 

 

κ°€μž₯ Baseκ°€ λ˜λŠ” MSE, RMSE, MAE의 νŠΉμ§•μ„ μ•Œμ•„λ³΄κ² μŠ΅λ‹ˆλ‹€.

 

MSE

- 미뢄이 μ‰½λ‹€λŠ” μž₯점이 μžˆμŠ΅λ‹ˆλ‹€

- μ—λŸ¬κ°€ 많이 ν‹€λ¦° κ²ƒμ²˜λŸΌ 생각 될 수 μžˆμŠ΅λ‹ˆλ‹€.

 

RMSE

- μ›λž˜ scale 둜 λ‚΄λ €μ„œ μ—λŸ¬κ°€ 많이 ν‹€λ¦° κ²ƒμ²˜λŸΌ 생각 될 수 μžˆλŠ” MSE의 단점을 κ°œμ„ ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

- alqnsdl djfuqtmqslek. 

 

MAE

- 미뢄이 μ•ˆλ˜λŠ” 뢀뢄이 μƒκΉλ‹ˆλ‹€.

 

 

 

μœ„μ˜ μ§€ν‘œλ“€μ„ ν•œ κ°€μ§€λ§Œμ„ μ‚¬μš©ν•˜λŠ” 것이 μ•„λ‹ˆλΌ μ—¬λŸ¬κ°œλ₯Ό λ™μ‹œμ— μ‚¬μš©ν•˜μ—¬ 각각의 μ§€ν‘œμ— λŒ€ν•œ 단점을 보완할 수 μžˆμŠ΅λ‹ˆλ‹€.

 

 

 

 

 

 

 

 

✍️ $R^2$ Model Evaluation(κ²°μ •κ³„μˆ˜ λͺ¨λΈν‰κ°€)

νŽΈμ°¨λŠ” SST(Sum of Squares Total), SSR(Regression Sum of Squares), SSE(Sum of Squares Error) μ„Έ κ°€μ§€λ‘œ λ‚˜νƒ€λ‚Ό 수 μžˆμŠ΅λ‹ˆλ‹€.

 

이λ₯Ό κ·Έλ¦Όκ³Ό μˆ˜μ‹μœΌλ‘œ μ„€λͺ…ν•˜λ©΄ μ•„λž˜μ™€ 같이 λ‚˜νƒ€λ‚Ό 수 μžˆμŠ΅λ‹ˆλ‹€.

 

 

 

 

 

 

 

 

μ΄λ•Œ $R^2$은 SST, SSR, SSEλ₯Ό μ‚¬μš©ν•˜μ—¬ λ‚˜νƒ€λ‚Ό 수 μžˆμŠ΅λ‹ˆλ‹€.

 

 

 

항상 $R^2$은 0보닀 ν¬κ±°λ‚˜ κ°™κ³  1보닀 μž‘κ±°λ‚˜ 같은 값을 κ°€μ§€κ²Œ λ©λ‹ˆλ‹€.

 

 

 

$R^2$이 1μ΄λΌλŠ” 것은 SSEκ°€ 0μ΄λΌλŠ” λœ»μž…λ‹ˆλ‹€.

 

즉, Errorκ°€ ν•˜λ‚˜λ„ μ—†λ‹€λŠ” λœ»μž…λ‹ˆλ‹€.

 

$R^2$이 0μ΄λΌλŠ” 것은 SSR이 0μ΄λΌλŠ” λœ»μž…λ‹ˆλ‹€.

 

즉, λͺ¨λ“  값이 ErrorλΌλŠ” λœ»μž…λ‹ˆλ‹€.

 

 

 

$R^2$이 1에 κ°€κΉŒμ›Œ 질 수둝 μ •ν™•ν•œ λͺ¨λΈμ΄κ³  0에 κ°€κΉŒμ›Œ 질 수둝 μ •ν™•ν•˜μ§€ μ•Šμ€ λͺ¨λΈμ„ μ˜λ―Έν•©λ‹ˆλ‹€.

 

 

 

 

 

 

 

λ…λ¦½λ³€μˆ˜μ˜ κ°œμˆ˜κ°€ μ¦κ°€ν•˜λ©΄ 일방적으둜 μ¦κ°€ν•˜λŠ” κ²°μ •κ³„μˆ˜μ™€ 달리 μ‘°μ •λœ κ²°μ •κ³„μˆ˜λŠ” 독립 λ³€μˆ˜κ°€ 증가할 λ–„ λΆ„μžλ₯Ό κ°μ†Œμ‹œμΌœμ£ΌλŠ” 연산을 톡해 일방적인 증가λ₯Ό λ°©μ§€ν•©λ‹ˆλ‹€.

 

이λ₯Ό Adjusted $R^2$(μ‘°μ •λœ κ²°μ •κ³„μˆ˜)이라고 ν•©λ‹ˆλ‹€.

 

μ•„λž˜μ˜ μ‹μ—μ„œ n은 ν‘œλ³Έμ˜ 수 pλŠ” 독립 λ³€μˆ˜μ˜ κ°œμˆ˜μž…λ‹ˆλ‹€.

 

 

 

 

예λ₯Ό λ“€μ–΄ n = 100, p = 50이라고 ν•  λ•Œ Adjusted $R^2$의 값은 $1 - \frac{99}{49}*\frac{SSE}{SST} = μ•½ 1 - 2*\frac{SSE}{SST}$ μž…λ‹ˆλ‹€.

 

n = 100, p = 2이라고 ν•  λ•Œ Adjusted $R^2$의 값은 $1 - \frac{99}{97}*\frac{SSE}{SST} = μ•½ 1 - \frac{SSE}{SST}$

 

λ…λ¦½λ³€μˆ˜μ˜ κ°œμˆ˜κ°€ 클 λ•Œ Adjusted $R^2$의 값이 더 μž‘μ€ 것을 μ•Œ 수 μžˆμŠ΅λ‹ˆλ‹€.

 

즉, λ…λ¦½λ³€μˆ˜κ°€ μœ μ˜ν•˜μ§€ μ•Šλ‹€λ©΄( λͺ¨λΈμ— 큰 영ν–₯을 λΌμΉ˜μ§€ μ•Šλ‹€λ©΄) λ…λ¦½λ³€μˆ˜μ˜ κ°œμˆ˜κ°€ μ¦κ°€ν•˜λ”λΌλ„ 값이 컀지지 μ•Šκ²Œ μ œμ–΄ν•˜λŠ” 역할을 ν•©λ‹ˆλ‹€.

 

 

 

 

 

 

πŸ”Ž Nonlinear Regression

Nonlinear Regression 에 λŒ€ν•΄μ„œλŠ” λ‹€μŒ κΈ°νšŒμ— μ•Œμ•„λ³΄λ„λ‘ ν•˜κ² μŠ΅λ‹ˆλ‹€.

 

 

 

 

 

 

 

 

 

 

 

πŸ”Ž Reference

https://www.dominodatalab.com/data-science-dictionary/model-evaluation

 

What is Model Evaluation? | Domino Data Science Dictionary

Model evaluation is the process of using different evaluation metrics to understand a machine learning model’s performance, as well as its strengths and weaknesses. Model evaluation is important to assess the efficacy of a model during initial research p

www.dominodatalab.com

 

'AI > Machine Learning' μΉ΄ν…Œκ³ λ¦¬μ˜ λ‹€λ₯Έ κΈ€

[ML] Nearest Neighbor Method - Distance Metric(1)  (0) 2022.11.11
[ML] Regression(νšŒκ·€)(3) - Logistic Regression(λ‘œμ§€μŠ€ν‹± νšŒκ·€)  (0) 2022.11.11
[ML] Regression(νšŒκ·€)(1) - Linear Regression(μ„ ν˜• νšŒκ·€)  (0) 2022.11.11
[ML] λ² μ΄μ§€μ•ˆ λΆ„λ₯˜κΈ°(Bayesian Classifier)(4) - Bayesian Classifier  (0) 2022.10.14
[ML] λ² μ΄μ§€μ•ˆ λΆ„λ₯˜κΈ°(Bayesian Classifier)(3) - Parameter Estimation  (0) 2022.10.14
    'AI/Machine Learning' μΉ΄ν…Œκ³ λ¦¬μ˜ λ‹€λ₯Έ κΈ€
    • [ML] Nearest Neighbor Method - Distance Metric(1)
    • [ML] Regression(νšŒκ·€)(3) - Logistic Regression(λ‘œμ§€μŠ€ν‹± νšŒκ·€)
    • [ML] Regression(νšŒκ·€)(1) - Linear Regression(μ„ ν˜• νšŒκ·€)
    • [ML] λ² μ΄μ§€μ•ˆ λΆ„λ₯˜κΈ°(Bayesian Classifier)(4) - Bayesian Classifier
    μ΄νƒœν™
    μ΄νƒœν™
    κ³΅λΆ€ν•˜μž νƒœν™μ•„

    ν‹°μŠ€ν† λ¦¬νˆ΄λ°”