๐คRegression
๊ด์ฐฐ๋ ์ฐ์ํ ๋ณ์๋ค์ ๋ํด ๋ ๋ณ์ ์ฌ์ด์ ๋ชจํ์ ๊ตฌํ ๋ค ์ ํฉ๋๋ฅผ ์ธก์ ํด ๋ด๋ ๋ถ์ ๋ฐฉ๋ฒ์ ๋๋ค.
์ฆ, $x$๊ฐ์ ๋ฐ๋ผ $y$๊ฐ์ด ์ด๋ ์ ๋๋ก ๋ณํํ ์ง ์์ธกํ ์ ์์ต๋๋ค.
ํ๊ท๋ถ์์ ์๊ฐ์ ๋ฐ๋ผ ๋ณํํ๋ ๋ฐ์ดํฐ๋ ์ด๋ค ์ํฅ, ๊ฐ์ค์ ์คํ, ์ธ๊ณผ ๊ด๊ณ์ ๋ชจ๋ธ๋ง๋ฑ์ ํต๊ณ์ ์์ธก์ ์ด์ฉ๋ ์ ์์ต๋๋ค.
ํ๊ท๋ถ์์ supervised learning(y๊ฐ ์กด์ฌํ๋ ํ์ต)์ ๋ํ์ ์ธ ๋ถ์ ๊ธฐ๋ฒ์ค ํ๋์ด๋ฉฐ continuousํ ๊ฐ๋ค์ ์ฐพ์ต๋๋ค.
์ด๋ฒ ์๊ฐ์๋ Logistic Regression ์ ๋ํด ๋ฐฐ์๋ณด๊ฒ ์ต๋๋ค.
Logistic Regression์ Non Linear Regresson์ ๋ํ์ ์ธ ๋ชจ๋ธ์ ๋๋ค.
๐ odds and Log(odds)
โ๏ธodds
odds๋ ํ๋ฅ ์ ๊ฐ๋ ์ ํฌํจํ๊ณ ์๋ ์งํ์ ๋๋ค.
์ฑ๊ณต ํ๋ฅ ์ $p$๋ผ๊ณ ํ ๋ ์คํจ ๋๋น ์ฑ๊ณต ํ๋ฅ ์ odds๋ผ๊ณ ํฉ๋๋ค.
$p$๊ฐ 1์ด๋ฉด odds๋ $\infty$ $p$๊ฐ 0์ด๋ฉด odds๋ 0์ ๋๋ค.
์ด๋ฅผ ์์์ผ๋ก ๋ํ๋ด๋ฉด ์๋์ ๊ฐ์ด ๋ํ๋ผ ์ ์๋ค.
$odds = \frac{p}{q} = \frac{p}{1-p} = \frac{๋ฒ์ฃผ 1์ ์ํ ํ๋ฅ }{๋ฒ์ฃผ 0์ ์ํ ํ๋ฅ }$
โ๏ธ Log(odds)
Log(odds)๋ odss์ ๋ก๊ทธ๋ฅผ ์ทจํ ์งํ์ ๋๋ค.
Log(odds)๋ฅผ ์ฌ์ฉํ๋ฉด ์ํ์ ์ผ๋ก ํธ๋ฆฌํ๋ค๋ ์ฅ์ ์ด ์์ต๋๋ค.
๋ํ ์๋์ ๊ทธ๋ฆผ๊ณผ ๊ฐ์ด Log(odds)๋ ๋์นญ ๊ทธ๋ํ๋ฅผ ๊ฐ์ง๋๋ค.
์์ ๊ฐ๊ณผ ์์ ๊ฐ์ ํตํด ํ์ธํ๊ธฐ ํธ๋ฆฌํฉ๋๋ค.
์ด๋ ์๋์ ๊ฐ์ด๋ํ๋ผ ์ ์์ต๋๋ค.
๐ Logistic Function
์์์ ์์๋ณธ log(odds)์ ๊ฐ์ ์์ ํตํด logistic function์ ๊ตฌํ ์ ์์ต๋๋ค.
ํด๋น ์๊ณผ ๊ทธ๋ํ๋ ์๋์ ๊ฐ์ด ๋ํ๋ผ ์ ์์ต๋๋ค.
Linear Regression์ ๊ฒฝ์ฐ ์์ธก๋ ๊ฐ์ธ Y๋ unboundedํฉ๋๋ค.
ํ์ง๋ง $X_1$์ ๋ณํ์ $\beta_1$์ ๊ฐ์ ํฌ๊ธฐ์ ๋ฐ๋ผ ํด์ ๊ฐ๋ฅํฉ๋๋ค.
๊ทธ์ ๋ฐํด Logistic Regression์ ๊ฒฝ์ฐ์๋ ์์ธก๋ ๊ฐ์ด 0๊ณผ 1 ์ฌ์ด์ ์กด์ฌํฉ๋๋ค.
๋ํ ํด๋น ๊ฐ๋ค์ $ln(\frac{p}{1-p}) = \sum b_iX_i$๋ก ๋ํ๋๊ธฐ ๋๋ฌธ์ ํด์ํ๊ธฐ ๋ณต์กํฉ๋๋ค.
์๋ฅผ ๋ค์ด Constant์ธ $\beta_0$์ ๊ฐ์ด -2.1 $\beta_1$์ ๊ฐ์ด 0.22๋ผ๊ณ ํ๊ฒ ์ต๋๋ค.
Y๊ฐ์ ๊ฒ์์ ์ด๊ธธ ํ๋ฅ ์ด๋ผ๊ณ ํ๊ณ X๊ฐ์ ์ ์์ ์ด ๊ธ์ฌ ํฉ๊ณ๋ผ๊ณ ํ๊ฒ ์ต๋๋ค.
์ด๋ฅผ ์์์ผ๋ก ๋ํ๋ด๋ฉด ์๋์ ๊ฐ์ต๋๋ค.
๊ทธ์ ๋ฐ๋ผ odds์ Log(odds)์ ๊ฐ์ ์๋์ ๊ฐ์ด ๋ํ๋ผ ์ ์์ต๋๋ค.
์์์ $\beta_1$์ ๊ฐ์ด 0.22๋ผ๋ ๋ป์ ์ ์์ ์ด ๊ธ์ฌ ํฉ๊ณ๊ฐ 1 ๋งํผ ์ฌ๋ผ๊ฐ ๋๋ง๋ค ๊ฒ์์ ์ด๊ธธ ํ๋ฅ ์ด 24.6%(exp(0.22) = 1.2460)์ด๋ผ๋ ๋ป์ ๋๋ค.
๋ค์ ํฌ์คํ ์์๋ Nearest Neighbor Method์ ๋ํด ํ์ตํ๊ฒ ์ต๋๋ค
'AI > Machine Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[ML] Nearest Neighbor Method - ์ ๊ทํ(Normalization)(2) (0) | 2022.11.11 |
---|---|
[ML] Nearest Neighbor Method - Distance Metric(1) (0) | 2022.11.11 |
[ML] Regression(ํ๊ท)(2) - Model Evaluation(๋ชจ๋ธ ํ๊ฐ) (0) | 2022.11.11 |
[ML] Regression(ํ๊ท)(1) - Linear Regression(์ ํ ํ๊ท) (0) | 2022.11.11 |
[ML] ๋ฒ ์ด์ง์ ๋ถ๋ฅ๊ธฐ(Bayesian Classifier)(4) - Bayesian Classifier (0) | 2022.10.14 |