π€Regression
κ΄μ°°λ μ°μν λ³μλ€μ λν΄ λ λ³μ μ¬μ΄μ λͺ¨νμ ꡬν λ€ μ ν©λλ₯Ό μΈ‘μ ν΄ λ΄λ λΆμ λ°©λ²μ λλ€.
μ¦, $x$κ°μ λ°λΌ $y$κ°μ΄ μ΄λ μ λλ‘ λ³νν μ§ μμΈ‘ν μ μμ΅λλ€.
νκ·λΆμμ μκ°μ λ°λΌ λ³ννλ λ°μ΄ν°λ μ΄λ€ μν₯, κ°μ€μ μ€ν, μΈκ³Ό κ΄κ³μ λͺ¨λΈλ§λ±μ ν΅κ³μ μμΈ‘μ μ΄μ©λ μ μμ΅λλ€.
νκ·λΆμμ supervised learning(yκ° μ‘΄μ¬νλ νμ΅)μ λνμ μΈ λΆμ κΈ°λ²μ€ νλμ΄λ©° continuousν κ°λ€μ μ°Ύμ΅λλ€.
μ΄λ² μκ°μλ Regression Modelμ λͺ¨λΈ νκ°μ λν΄ μμ보λλ‘ νκ² μ΅λλ€.
λͺ¨λΈ νκ°μ λν μμΈν λ΄μ©μ ν λ² λ λ€λ£¨λλ‘ νκ² μ΅λλ€.
π Model Evaluation
λͺ¨λΈ νκ°λ λ€μν νκ° λ°©λ²μ μ¬μ©νμ¬ λ¨Έμ λ¬λ λͺ¨λΈμ μ±λ₯κ³Ό κ°μ κ³Ό μ½μ μ μ΄ν΄νλ νλ‘μΈμ€μ λλ€.
λͺ¨λΈ νκ°λ μ΄κΈ° μ°κ΅¬ λ¨κ³μμ λͺ¨λΈμ μ ν¨μ±μ νκ°νλ λ° μ€μνλ©° λͺ¨λΈ λͺ¨λν°λ§μμλ μν μ ν©λλ€.
λͺ¨λΈμ΄ μ λ°μ΄ν°μ μ μλνλμ§ μ΄ν΄νκΈ° μν΄ μ¬λ¬ νκ° μ§νλ₯Ό νμ©ν μ μμ΅λλ€.
μ ν νκ·λ₯Ό λ°°μ΄ λ§νΌ μ ν νκ·μ λν Model Evaluationμ μ€μ¬μΌλ‘ μμλ³΄κ² μ΅λλ€.
https://www.dominodatalab.com/data-science-dictionary/model-evaluation
π Performance Measurements
λͺ¨λΈμ μΈ‘μ νλ λ°©λ²μ λ§€μ° λ€μν©λλ€.
$y$μ $\hat{y}$λ₯Ό κΈ°λ°μΌλ‘ μ°¨μ΄ μΈ‘μ νλ λ°©λ²κ³Ό $R^2$ Model Evaluation μ λν΄ μμλ³΄κ² μ΅λλ€.
βοΈ $y$μ $\hat{y}$λ₯Ό κΈ°λ°μΌλ‘ μ°¨μ΄ μΈ‘μ νκΈ°
λλΆλΆμ λ°©λ²λ€μ μ€μ μΈ‘μ κ°μΈ $y$μ μμΈ‘κ°μΈ $\hat{y}$μμ μ°¨μ΄λ₯Ό λΉκ΅νλ κ²μμ μμν©λλ€.
μ΄λ₯Ό μ 리νλ©΄ μλμ κ°μ΄ λνλΌ μ μμ΅λλ€.
κ°μ₯ Baseκ° λλ MSE, RMSE, MAEμ νΉμ§μ μμλ³΄κ² μ΅λλ€.
MSE
- λ―ΈλΆμ΄ μ½λ€λ μ₯μ μ΄ μμ΅λλ€
- μλ¬κ° λ§μ΄ νλ¦° κ²μ²λΌ μκ° λ μ μμ΅λλ€.
RMSE
- μλ scale λ‘ λ΄λ €μ μλ¬κ° λ§μ΄ νλ¦° κ²μ²λΌ μκ° λ μ μλ MSEμ λ¨μ μ κ°μ ν μ μμ΅λλ€.
- alqnsdl djfuqtmqslek.
MAE
- λ―ΈλΆμ΄ μλλ λΆλΆμ΄ μκΉλλ€.
μμ μ§νλ€μ ν κ°μ§λ§μ μ¬μ©νλ κ²μ΄ μλλΌ μ¬λ¬κ°λ₯Ό λμμ μ¬μ©νμ¬ κ°κ°μ μ§νμ λν λ¨μ μ 보μν μ μμ΅λλ€.
βοΈ $R^2$ Model Evaluation(κ²°μ κ³μ λͺ¨λΈνκ°)
νΈμ°¨λ SST(Sum of Squares Total), SSR(Regression Sum of Squares), SSE(Sum of Squares Error) μΈ κ°μ§λ‘ λνλΌ μ μμ΅λλ€.
μ΄λ₯Ό κ·Έλ¦Όκ³Ό μμμΌλ‘ μ€λͺ νλ©΄ μλμ κ°μ΄ λνλΌ μ μμ΅λλ€.
μ΄λ $R^2$μ SST, SSR, SSEλ₯Ό μ¬μ©νμ¬ λνλΌ μ μμ΅λλ€.
νμ $R^2$μ 0λ³΄λ€ ν¬κ±°λ κ°κ³ 1λ³΄λ€ μκ±°λ κ°μ κ°μ κ°μ§κ² λ©λλ€.
$R^2$μ΄ 1μ΄λΌλ κ²μ SSEκ° 0μ΄λΌλ λ»μ λλ€.
μ¦, Errorκ° νλλ μλ€λ λ»μ λλ€.
$R^2$μ΄ 0μ΄λΌλ κ²μ SSRμ΄ 0μ΄λΌλ λ»μ λλ€.
μ¦, λͺ¨λ κ°μ΄ ErrorλΌλ λ»μ λλ€.
$R^2$μ΄ 1μ κ°κΉμ μ§ μλ‘ μ νν λͺ¨λΈμ΄κ³ 0μ κ°κΉμ μ§ μλ‘ μ ννμ§ μμ λͺ¨λΈμ μλ―Έν©λλ€.
λ 립λ³μμ κ°μκ° μ¦κ°νλ©΄ μΌλ°©μ μΌλ‘ μ¦κ°νλ κ²°μ κ³μμ λ¬λ¦¬ μ‘°μ λ κ²°μ κ³μλ λ 립 λ³μκ° μ¦κ°ν λ λΆμλ₯Ό κ°μμμΌμ£Όλ μ°μ°μ ν΅ν΄ μΌλ°©μ μΈ μ¦κ°λ₯Ό λ°©μ§ν©λλ€.
μ΄λ₯Ό Adjusted $R^2$(μ‘°μ λ κ²°μ κ³μ)μ΄λΌκ³ ν©λλ€.
μλμ μμμ nμ νλ³Έμ μ pλ λ 립 λ³μμ κ°μμ λλ€.
μλ₯Ό λ€μ΄ n = 100, p = 50μ΄λΌκ³ ν λ Adjusted $R^2$μ κ°μ $1 - \frac{99}{49}*\frac{SSE}{SST} = μ½ 1 - 2*\frac{SSE}{SST}$ μ λλ€.
n = 100, p = 2μ΄λΌκ³ ν λ Adjusted $R^2$μ κ°μ $1 - \frac{99}{97}*\frac{SSE}{SST} = μ½ 1 - \frac{SSE}{SST}$
λ 립λ³μμ κ°μκ° ν΄ λ Adjusted $R^2$μ κ°μ΄ λ μμ κ²μ μ μ μμ΅λλ€.
μ¦, λ 립λ³μκ° μ μνμ§ μλ€λ©΄( λͺ¨λΈμ ν° μν₯μ λΌμΉμ§ μλ€λ©΄) λ 립λ³μμ κ°μκ° μ¦κ°νλλΌλ κ°μ΄ 컀μ§μ§ μκ² μ μ΄νλ μν μ ν©λλ€.
π Nonlinear Regression
Nonlinear Regression μ λν΄μλ λ€μ κΈ°νμ μμ보λλ‘ νκ² μ΅λλ€.
π Reference
https://www.dominodatalab.com/data-science-dictionary/model-evaluation