๐ค Neural Network
์ธ๊ณต์ ๊ฒฝ๋ง(ไบบๅทฅ็ฅ็ถ็ถฒ, ์์ด: artificial neural network, ANN)์ ๊ธฐ๊ณํ์ต๊ณผ ์ธ์ง๊ณผํ์์ ์๋ฌผํ์ ์ ๊ฒฝ๋ง(๋๋ฌผ์ ์ค์ถ์ ๊ฒฝ๊ณ์ค ํนํ ๋)์์ ์๊ฐ์ ์ป์ ํต๊ณํ์ ํ์ต ์๊ณ ๋ฆฌ์ฆ์ ๋๋ค.
์ธ๊ณต์ ๊ฒฝ๋ง์ ์๋ ์ค์ ๊ฒฐํฉ์ผ๋ก ๋คํธ์ํฌ๋ฅผ ํ์ฑํ ์ธ๊ณต ๋ด๋ฐ(๋ ธ๋)์ด ํ์ต์ ํตํด ์๋ ์ค์ ๊ฒฐํฉ ์ธ๊ธฐ๋ฅผ ๋ณํ์์ผ, ๋ฌธ์ ํด๊ฒฐ ๋ฅ๋ ฅ์ ๊ฐ์ง๋ ๋ชจ๋ธ ์ ๋ฐ์ ๊ฐ๋ฆฌํต๋๋ค.
์ด๋ฒ ํฌ์คํ ์์๋ ์ ํ ๋ถ๋ฆฌ ๊ฐ๋ฅ์ฑ(Linear Separability)์ ๋ํด ์์๋ณด๊ฒ ์ต๋๋ค.
๐ Linear Separability(์ ํ ๋ถ๋ฆฌ ๊ฐ๋ฅ์ฑ)
Linear Separability๋ ์ง์ ํ๋๋ก ์ด๋ป๊ฒ ๊ณต๊ฐ์ ๋ถ๋ฆฌํ ๊ฒ์ธ๊ฐ์ ๋ํ ์ด๋ก ์ ๋๋ค.
์๋์ ๊ฐ์ ๋ฐ์ดํฐ๊ฐ ์กด์ฌํ๋ค๊ณ ํ๊ฒ ์ต๋๋ค.
์ด๋ ๋นจ๊ฐ์ ์ ๊ธฐ์ค์ผ๋ก ๋ ๊ฐ์ง ํด๋์ค์ ๋ฐ์ดํฐ๋ฅผ ๋๋ ์ ์์ต๋๋ค.
๋นจ๊ฐ์ ์ x์ ํธ๊ณผ y์ ํธ์ด ๊ฐ๊ฐ 2๋ผ๋ฉด ์์ ๊ฐ์ ์์ ์ป์ ์ ์์ต๋๋ค.
๊ทธ๋์ ๋นจ๊ฐ์ ์ ์์ชฝ ์์ญ์ $g(x) > 0$์ ํด๋นํ์ฌ Class 1์ ์๋ฏธํ๋ฉฐ, ์๋์ชฝ ์์ญ์ $g(x) < 0$์ ํด๋นํ์ฌ Class -1์ ์๋ฏธํฉ๋๋ค.
์ด๋ฅผ ์ผ๋ฐํํ๊ฒ ๋๋ค๋ฉด $g(x_1, x_2) = w_1x_1 + w_2x_2 + w_0 = 0$์ด๋ผ๊ณ ํ ์ ์์ต๋๋ค.
์ด๋ $w_1$, $w_2$, $w_0$์ ํ๋ผ๋ฏธํฐ๋ผ๊ณ ๋ถ๋ฆ ๋๋ค.
์ด๋ฅผ ๋คํธ์ํฌ์ ๋ํ ๊ทธ๋ฆผ์ผ๋ก ๋ํ๋ด๋ฉด ์๋์ ๊ฐ์ต๋๋ค.
$x_1$, $x_2$๋ผ๋ ๋ฐ์ดํฐ๊ฐ ๋ค์ด์์๋ ๊ฐ๊ฐ์ ํ๋ผ๋ฏธํฐ๋ฅผ ๊ณฑํ ๋ค ์ด๋ฅผ ๋ํด์ค๋๋ค.
์ด๋ $w_0$๋ bias๋ฅผ ์๋ฏธํฉ๋๋ค.
0๋ณด๋ค ํฐ ์ง ์์ ์ง์ ๋ํ ํ๋จ ๊ธฐ์ค์ ํตํด ํด๋น ๋ฐ์ดํฐ๊ฐ ์ด๋ค Class์ ์กด์ฌํ๋์ง ๊ฒฐ์ ํฉ๋๋ค.
โ Multivariate Problem
์์ ์์ Multivariate Problem์ผ๋ก ์ผ๋ฐํํ๊ฒ ๋๋ค๋ฉด ์๋์ ์์ ์ป์ ์ ์์ต๋๋ค.
๋ฒกํฐ์ ํํ๋ก ๋ํ๋์ ๋ $g(x) = w^Tx$๋ผ๋ ๊ฐ์ ์ป์ ์ ์์ต๋๋ค. ( $w_0$ ๋ ๋ฒกํฐ์ $w_0$์ $x_0 = 1$์ ์ถ๊ฐํ์ฌ ์๋ตํ ์ ์์ต๋๋ค.)
์ด๋ฅผ ๊ทธ๋ฆผ์ผ๋ก ๋ํ๋ด๋ฉด ์๋์ ๊ฐ์ต๋๋ค.
์์ ๋นจ๊ฐ์ ๊ธ์จ๋ ์ธ์๋์๋ ๊ฒ์ ์ถ์ฒ๋๋ฆฝ๋๋ค.
weight๋ ํ๋ผ๋ฏธํฐ๋ผ๊ณ ์๊ฐํ๋ฉด ๋๊ณ scale์ ๊ดํ ๋ด์ฉ์ ์ดํ์ ์ค๋ช ํ๊ฒ ์ต๋๋ค.
weighted summation๊น์ง ์งํํ ๋ค output์ ๋ด๋ ๊ฒ์ด ์๋๋ผ ํ์ฑํ ํจ์๊น์ง ๊ฑฐ์น ํ์ output์ ๋ด์ผ ํ๋ค๋ ๊ฒ์ ์ฃผ์ํด์ผ ํฉ๋๋ค.
โ Activation function
์์ ๋ด์ฉ์์ ํ์ฑํ ํจ์๋ 0๋ณด๋ค ํฌ๋ฉด 1์ด๋ผ๋ ๊ฐ์ 0๋ณด๋ค ์์ผ๋ฉด 0์ด๋ผ๋ ๊ฐ์ ๋ด๋ณด๋ ๋๋ค.
์๋์ ๊ทธ๋ฆผ์์ ๊ฐ์ฅ ์ฐ์ธก์ ๊ทธ๋ํ๋ฅผ ์๋ฏธํฉ๋๋ค. ( ์คํ.. 1๋ณด๋ค ํฐ ๊ฒ์ด ์๋๋ผ 0๋ณด๋ค ํฐ ๊ฒ )
ํด๋น ๊ทธ๋ํ์ ๊ฐ์ฅ ํฐ ๋ฌธ์ ๋ ๋ฏธ๋ถ์ด ๋ถ๊ฐ๋ฅํ๋ค๋ ๊ฒ์ ๋๋ค.
๋๋ถ๋ถ์ ๋จธ์ ๋ฌ๋ ์๊ณ ๋ฆฌ์ฆ๋ค์ ๋ฏธ๋ถ์ ํตํด ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋๋ฐ ๋ฏธ๋ถ์ด ๋์ง ์๋๋ค๋ฉด ์๊ณ ๋ฆฌ์ฆ์ ํ์ต์ํฌ ์ ์์ต๋๋ค.
์ด๋ฅผ ํด๊ฒฐํ ๊ฒ์ด ์ผ์ชฝ ๋ ๊ฐ์ ๊ทธ๋ํ์ ๋๋ค.
ํ์ง๋ง Logistic function์ ๊ฒฝ์ฐ 0 ~ 1 ์ฌ์ด์ ๊ฐ์ ๊ฐํ์๊ธฐ ๋๋ฌธ์ Negative์ ๊ฐ์ ์ป์ ์ ์์ต๋๋ค.
์ด๋ฅผ ํด๊ฒฐํ ๊ฒ์ด ํ์ดํผ๋ณผ๋ฆญ ํ์ ํธ, ๊ฐ์ฅ ์ผ์ชฝ์ ๊ทธ๋ํ๋ฅผ ์๋ฏธํฉ๋๋ค.
์์๋ฅผ ํตํด ์ด๋ฅผ ํ์ธํ๊ฒ ์ต๋๋ค.
์์ ๊ฐ์ ๊ทธ๋ํ๊ฐ ์๋ค๊ณ ํ์ ๋ ์์์ ๋ณด์๋ ์ธ ๊ฐ์ง ํ์ฑํ ํจ์๋ฅผ ์ ์ฉํ๋ฉด ์๋์ ํ์ ๊ฐ์ด ๋ํ๋ผ ์ ์์ต๋๋ค.
๋ค์ ํฌ์คํ ์์๋ MLP์ ๋ํด ์์๋ณด๊ฒ ์ต๋๋ค.
'AI > Machine Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[ML] Neural Network(4) - ์์ ํ(Feedforward Process) (0) | 2022.12.01 |
---|---|
[ML] Neural Network(3) - MLP(Multilayer Perceptron) (0) | 2022.12.01 |
[ML] Neural Network(1) - Introduction (0) | 2022.12.01 |
[ML] Ensemble Method(6) - Summary (0) | 2022.11.30 |
[ML] Ensemble Method(5) - XGBoost (0) | 2022.11.30 |