๐คEnsemble Method(์์๋ธ ํ์ต๋ฒ)
ํต๊ณํ๊ณผ ๊ธฐ๊ณ ํ์ต์์ ์์๋ธ ํ์ต๋ฒ์ ํ์ต ์๊ณ ๋ฆฌ์ฆ๋ค์ ๋ฐ๋ก ์ฐ๋ ๊ฒฝ์ฐ์ ๋นํด ๋ ์ข์ ์์ธก ์ฑ๋ฅ์ ์ป๊ธฐ ์ํด ๋ค์์ ํ์ต ์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉํ๋ ๋ฐฉ๋ฒ ์ ๋๋ค.
ํต๊ณ ์ญํ์์์ ํต๊ณ์ ์์๋ธ๊ณผ ๋ฌ๋ฆฌ ๊ธฐ๊ณ ํ์ต์์์ ์์๋ธ์ ๋์ฒด ๋ชจ๋ธ๋ค์ ๋จ๋จํ ์ ํ ์งํฉ์ ๊ฐ๋ฆฌํค์ง๋ง, ์ผ๋ฐ์ ์ผ๋ก ๊ทธ๋ฌํ ๋์ฒด ๋ชจ๋ธ ์ฌ์ด์ ํจ์ฌ ๋ ์ ์ฐํ ๊ตฌ์กฐ๋ฅผ ํ์ฉํฉ๋๋ค.
์ด๋ฒ ํฌ์คํ ์์๋ ์์๋ธ ํ์ต๋ฒ์ ๋ฐฐ์ฐ๊ธฐ ์ ํธํฅ๊ณผ ๋ถ์ฐ์ฌ์ด์ ๋๋ ๋ง์ ๋ํด ์์๋ณด๋ ค๊ณ ํฉ๋๋ค.
๐ ํธํฅ ๋ถ์ฐ ๋๋ ๋ง
์์๋ธ์ ๋ํด ์กฐ๊ธ ์ฝ๊ฒ ์ค๋ช ํ๊ธฐ ์ํด ์์๋ฅผ ๋ค์ด๋ณด๊ฒ ์ต๋๋ค.
์์ ๊ทธ๋ฆผ๊ณผ ๊ฐ์ด ํ ๊ฐ์ง์ ๋ฌธ์ ์ ๋ํด ์ฌ๋ฌ๊ฐ์ง์ ๋ชจ๋ธ์ ์ฌ์ฉํ์ฌ ํ์ต์ ์งํํ๋ค๊ณ ํ๊ฒ ์ต๋๋ค.
์ด๋ ํ ๊ฐ์ ๋ชจ๋ธ์ด ํ์ตํ๋ ๋ฌธ์ ๊ฐ Training set ์ ์ฒด ๋ฐ์ดํฐ๋ผ๋ฉด ๋๋ถ๋ถ ๋น์ทํ ๊ฒฐ๊ณผ๋ฅผ ๋์ถํฉ๋๋ค.
๊ทธ๋ ๊ธฐ ๋๋ฌธ์ ๋ชจ๋ธ์ด ์ ์ฒด ํ์ต ๋ฐ์ดํฐ๊ฐ ์๋ ๋ฐ์ดํฐ์ ์ผ๋ถ๋ฅผ ๋๋์ด ํ์ต์ ์งํํฉ๋๋ค.
์ด๋ฅผ ์ฝ๊ฒ ๋น์ ํ์๋ฉด ์ต๊ทผ ์์๋ ์๋ฅ์์ 21๋ฒ 30๋ฒ ๋ฌธ์ ๋ฅผ ์ ํธ๋ ํ์๊ณผ ๋๋จธ์ง ์ค ํฌ๋ฌ๋ฌธ์ ๋ฅผ ์ ํธ๋ ํ์์ ๋๋์ด ํ์ต์ ์ํต๋๋ค.
ํด๋น ํ์๋ค์ด ํจ๊ผ ์๋ฅ ๋ฌธ์ ๋ฅผ ํผ๋ค๋ฉด ๋ ์ข์ ์ฑ๋ฅ์ ๋ผ ์ ์๋ค๋ ๊ฒ์ ๋๋ค.
์์ ๋ฐ์ดํฐ์์ ๋๋ค์ผ๋ก ์ํ๋ง์ ํ์ฌ ๋ฐ์ดํฐ๋ฅผ ํ์ตํ๋ค๋ฉด ์กฐ๊ธ์ฉ ๋ค๋ฅธ ๊ฒฐ๊ณผ๋ฅผ ๋์ถํ ๊ฒ์ ๋๋ค.
๊ฐ์ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ๋ค๊ณ ํ๋๋ผ๋ ํ์ดํผํ๋ผ๋ฏธํฐ๋ฅผ ๋ค๋ฅด๊ฒ ํ ์๋ ์์ต๋๋ค.
์๋ฅผ ๋ค์ด ๊ฐ์ Decision Tree๋๋ผ๋ Depth๋ฅผ ๋ค๋ฅด๊ฒ ํ๋ค๋ฉด ๋ค๋ฅธ prediction ๊ฒฐ๊ณผ๋ฅผ ์ป์ ์ ์์ต๋๋ค.
ํ๋ฅ ์ ์๊ณ ๋ฆฌ์ฆ(Stochastic Algorithm)๊ณผ ๋ฐ๋๋๋ ๊ฐ๋ ์ผ๋ก ํ์ ์ ์๊ณ ๋ฆฌ์ฆ(Determinstic Algorithm)์ด ์กด์ฌํฉ๋๋ค.
์ฆ, ๊ฐ์ ๋ฐ์ดํฐ๋ฅผ ๊ฐ์ง๊ณ ์๋ค๋ฉด ๋ชจ๋ธ์ ๋ง๋ค ๋๋ง๋ค ๊ฒฐ๊ณผ๊ฐ ๊ฐ๋ค๋ ๋ป์ ๋๋ค.
ํ์ง๋ง NN๊ณผ ๊ฐ์ ํ๋ฅ ๊ธฐ๋ฐ์ ๋ชจ๋ธ์ ๋๋ค์ฑ์ด ๋ดํฌ๋์ด ๋ค๋ฅธ ๊ฒฐ๊ณผ๊ฐ ๋์ฌ ์ ์์ต๋๋ค.
๋จผ์ ํธํฅ๊ณผ ๋ถ์ฐ์ด ์ด๋ค ๊ฒ์ธ๊ฐ์ ๋ํด ์์๋ณด๋๋ก ํ๊ฒ ์ต๋๋ค.
โ๏ธ ํธํฅ(Bias)๊ณผ ๋ถ์ฐ(Variance)์ด๋?
ํธํฅ(Bias)
ํธํฅ์ด๋ ์ค์ ๊ฐ๊ณผ ์ด๋ ํ ๊ฐ์ผ๋ก ๋ํ๋ ๊ฒ์ด๋ผ๊ณ ๊ธฐ๋๋๋ ์์ธก๊ฐ์ ํ๊ท ๊ณผ์ ์ฐจ์ด์ ๋๋ค.
์ด๋ฅผ ์์์ผ๋ก ๋ํ๋ด๋ฉด ์๋์ ๊ฐ์ต๋๋ค.
๋ถ์ฐ(Variance)
๋ถ์ฐ์ ์์ธก๊ฐ๊ณผ ์์ธก๊ฐ์ ํ๊ท ๊ณผ์ ์ฐจ์ด์ ๋๋ค.
๋ง ๊ทธ๋๋ก ์์ธก์น ๊ฐ๊ณผ์ ๋จ์ด์ ธ์๋ ์ ๋๋ฅผ ๋ํ๋ ๋๋ค.
์ฆ, ์์ธก๊ฐ์ ๋ณ๋์ฑ์ด ์ผ๋ง๋ ํฐ ๊ฐ๋ฅผ ์๋ฏธํฉ๋๋ค.
์ด๋ฅผ ์์์ผ๋ก ๋ํ๋ด๋ฉด ์๋์ ๊ฐ์ต๋๋ค.(ํธ์ฐจ ์ ๊ณฑ์ ํ๊ท )
โ๏ธ ํธํฅ-๋ถ์ฐ ๋ถํด(Bias-Variance Decomposition)
์ฐ๋ฆฌ๊ฐ ๋ฐฐ์ ๋ Error์ค ๊ฐ์ฅ ๋ํ์ ์ธ Error ๋ MSE(Mean Squared Error)์ ๋๋ค.
ํด๋น ์์์ ์ ๊ฐํ์ฌ ์ดํด๋ณด๊ฒ ์ต๋๋ค.
์์ ์์์ ํตํด ๊ฒฐ๊ตญ ํธ์ฐจ์ ๋ถ์ฐ์ ํฉ์ผ๋ก ๋ํ๋์ ธ ์๋ค๋ ๊ฒ์ ์ ์ ์์ต๋๋ค.
์ฆ, Error๊ฐ fixed ๋์ด ์๋ ์ํฉ์์ ์ด๋ค model์ Bias๊ฐ ๋ฎ๋ค๋ ๊ฒ์ ๊ฐ์ MSE์์ Variance๊ฐ ์ปค์ง๊ณ ๋ฐ๋๋ก Bias๊ฐ ํฌ๋ค๋ ๊ฒ์ Variance๊ฐ ์๋ค๋ ๊ฒ์ ์๋ฏธํฉ๋๋ค.
์ด๋ ํธํฅ๊ณผ ๋ถ์ฐ์ด trade-off์ ๊ด๊ณ์ ์๋ค๊ณ ํ ์ ์์ต๋๋ค.
โ๏ธ ํธํฅ-๋ถ์ฐ๊ณผ Over/Underfit์ ๊ด๊ณ
Bias๋ผ๋ ๊ฒ์ ๊ฒฐ๊ตญ model์ fitting๋ฅ๋ ฅ์ ๋๋ค.
Bias๋ฅผ ๋ฎ์ถ์ด model์ fitting๋ฅ๋ ฅ์ ๋๋ฆฌ๋ฉด ์์์ ์ค๋ช ํ๋ฏ ํธํฅ๊ณผ ๋ถ์ฐ์ trade-off๊ด๊ณ๋ผ์ HIgh variance๋ฅผ ๊ฐ์ง๊ฒ ๋ฉ๋๋ค.
์ด ๊ฒฝ์ฐ ๋น์ทํ ๊ฐ์ ๋ฐ์ดํฐ๊ฐ ๋ค์ด์ ๋ชจ๋ธ ํ์ต์ ๋ค์ ์งํํ๋ค๋ฉด ๊ฐ์ ๋ชจ๋ธ์ ์ฌ์ฉํ๋๋ผ๋ ๊ทธ๋ํ๋ ๋งค์ฐ ๋ฏผ๊ฐํ๊ฒ ๋ฌ๋ผ์ง ๊ฒ์ ๋๋ค.
์์ ๊ฐ์ ๊ฒฝ์ฐ๋ฅผ Overfit์ด๋ผ๊ณ ํฉ๋๋ค.
๋ฐ๋๋ก Bias๊ฐ ๋๋ค๊ณ ํ๋ฉด ๋น์ทํ ๊ฐ์ ๋ฐ์ดํฐ๊ฐ ๋ค์ด์ ๋ชจ๋ธ ํ์ต์ ๋ท๊ธฐ ์งํํ๋ค๊ณ ํ๋๋ผ๋ ๊ทธ๋ํ์ ์ฐจ์ด๋ ํฌ์ง ์์ต๋๋ค.
์ฆ, ๋ฎ์ Variance๋ฅผ ๊ฐ์ง๋ค๋ ๋ป์ด๋ฉฐ ์ด๋ฅผ Underfit์ด๋ผ๊ณ ํฉ๋๋ค.
์ด๋ฅผ running curve๋ก ๋ํ๋ด๋ฉด ์๋์ ๊ฐ์ต๋๋ค.
x์ถ์ ๋ฅ๋ ฅ์น์ด์ ๋ณต์ก๋ ์ ๋๋ค.
์ต์ ์ ๋ฅ๋ ฅ์น๋ฅผ ๊ฐ์ง ๋ชจ๋ธ์ ๊ฒฐ๊ตญ ์ ๋นํ(?) ์ ๋๋ฅผ ์ฐพ์์ผ ํฉ๋๋ค.
์๋์ ๊ทธ๋ฆผ์์ C์ ๊ฒฝ์ฐ Capacity๊ฐ ๋์ ๋ชจ๋ธ๋ก Low Bias / High Variance ๋ชจ๋ธ์ ๋๋ค.
D์ ๊ฒฝ์ฐ Capacity๊ฐ ๋ฎ์ ๋ชจ๋ธ๋ก High Bias / Low Variance ๋ชจ๋ธ์ธ ๊ฒ์ ์ ์ ์์ต๋๋ค.
๋ค์ ํฌ์คํ ์์๋ ์์๋ธ์ ๊ธฐ๋ฒ์ ๋ํด ์์๋ณด๋๋ก ํ๊ฒ ์ต๋๋ค.
'AI > Machine Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[ML] Ensemble Method(3) - AdaBoost (0) | 2022.11.29 |
---|---|
[ML] Ensemble Method(2) - Bagging & Random Forest (0) | 2022.11.26 |
[ML] Nearest Neighbor Method - KNN(3) (0) | 2022.11.11 |
[ML] Nearest Neighbor Method - ์ ๊ทํ(Normalization)(2) (0) | 2022.11.11 |
[ML] Nearest Neighbor Method - Distance Metric(1) (0) | 2022.11.11 |