๐ค Neural Network
์ธ๊ณต์ ๊ฒฝ๋ง(ไบบๅทฅ็ฅ็ถ็ถฒ, ์์ด: artificial neural network, ANN)์ ๊ธฐ๊ณํ์ต๊ณผ ์ธ์ง๊ณผํ์์ ์๋ฌผํ์ ์ ๊ฒฝ๋ง(๋๋ฌผ์ ์ค์ถ์ ๊ฒฝ๊ณ์ค ํนํ ๋)์์ ์๊ฐ์ ์ป์ ํต๊ณํ์ ํ์ต ์๊ณ ๋ฆฌ์ฆ์ ๋๋ค.
์ธ๊ณต์ ๊ฒฝ๋ง์ ์๋ ์ค์ ๊ฒฐํฉ์ผ๋ก ๋คํธ์ํฌ๋ฅผ ํ์ฑํ ์ธ๊ณต ๋ด๋ฐ(๋ ธ๋)์ด ํ์ต์ ํตํด ์๋ ์ค์ ๊ฒฐํฉ ์ธ๊ธฐ๋ฅผ ๋ณํ์์ผ, ๋ฌธ์ ํด๊ฒฐ ๋ฅ๋ ฅ์ ๊ฐ์ง๋ ๋ชจ๋ธ ์ ๋ฐ์ ๊ฐ๋ฆฌํต๋๋ค.
์ด๋ฒ ํฌ์คํ ์์๋ ์ญ์ ํ์ ๋ํด ์์๋ณด๊ฒ ์ต๋๋ค.
๐ ์์คํจ์(Loss Function)
์ค์ ๋ก ๋ง์ด ์ฌ์ฉ๋๋ ์์ค ํจ์์ ๋ํด ์์๋ณด๊ฒ ์ต๋๋ค
Cross Entropy Loss Function, Softmax(multi class์์ output node์ activaition func), Sigmoid(hidden node์ activation func), ReLU(hidden node์ activation func) ๋ฑ์ด ์์ต๋๋ค.
ํด๋น ํจ์๋ค์ ๋ฏธ๋ถ์ ์๋์ ๊ทธ๋ฆผ๊ณผ ๊ฐ์ต๋๋ค.
Cross Entropy์ ๊ฒฝ์ฐ Classification์์ ์ฌ์ฉํ์ง๋ง Regression์ ๊ฒฝ์ฐ MSE๋ฅผ ์ฌ์ฉํฉ๋๋ค.
๋ฏธ๋ถ ๊ฐ๋ค์ด ๋ชจ๋ ๊ฐ๋จํ๊ฒ ๊ณ์ฐ๋๊ธฐ ๋๋ฌธ์ ํด๋น term๋ค์ NN์ ๋ง์ด ์ฌ์ฉํ๊ณ ์์ต๋๋ค.
๐ ์ญ์ ํ ์์ธํ ๋ณด๊ธฐ
์ ํฌ์คํ ์์ $f'(net)$์ด๋ผ๊ณ ํ๋ฉฐ ๋์ด๊ฐ๋ ๋ถ๋ถ์ ์ด์ ๋ ์์ ํจ์๋ค์ ํตํด ๋ค์ ๋ํ๋ผ ์ ์์ต๋๋ค.
โ Hidden to Output
โ Input to Hidden
๐ Learning Rate
Gradinent Descent๋ฅผ ํ ๋ Gradient๋ฅผ ์ผ๋งํผ ๋ฐ์ํ ๊ฒ์ธ๊ฐ์ ๋ํ ํ์ดํผ ํ๋ผ๋ฏธํฐ์ ๋๋ค.
์ด๋ฅผ ์์์ผ๋ก ๋ํ๋ด๋ฉด ์๋์ ๊ฐ์ต๋๋ค.
๋ง์ฝ ๋๋ฌด ํฐ Rate๋ฅผ ๊ฐ์ง๊ฒ ๋๋ฉด ๋ฐ์ฐํ๊ฒ ๋๊ณ ๋๋ฌด ์์ Rate๋ฅผ ๊ฐ์ง๊ฒ ๋๋ฉด ์ต์ ์ ์ ์ฐพ๋ ๊ฒ์ด ์ค๋๊ฑธ๋ฆฌ๊ฒ ๋ฉ๋๋ค.
Big learning rate
์ฅ์ : ๋์ ์๋๋ฅผ ๋ณด์ธ๋ค
๋จ์ : ๋ฐ์ฐ ๊ฐ๋ฅํ๋ค
Small learning rate
์ฅ์ : ๋ฐ์ฐํ ์ํ์ด ์๋ค
๋จ์ : ์๋ ด์ง์ฐ
๊ทธ๋์ ์ฐ๋ฆฌ๋ adaptive learning rate๋ฅผ ์ฌ์ฉํฉ๋๋ค.
์๋๋ฅผ ๋ณํํ๋ฉด์ ํ์ต์ ์งํํฉ๋๋ค.
๐ Local Optima Problem
์์ ๋ฐฉ๋ฒ๋ค์ ํตํด์ ์ ์ ์ ์ฐพ์ ์๋ ์์ง๋ง ๊ทธ๊ฒ์ด best solution์ด๋ผ๊ณ ๋ ํ ์ ์์ต๋๋ค
์ฐ๋ฆฌ๋ local minimum์ ์ฐพ๋ ๊ฒ ๋ฟ์ ๋๋ค.
๊ทธ๋ ๊ธฐ ๋๋ฌธ์ ์ข์ local optimum์ ์ฐพ๊ธฐ์ํด ๋ ธ๋ ฅํด์ผ ํฉ๋๋ค.
์ข์ local optima๋ฅผ ์ฐพ๊ธฐ ์ํด bad local optima๋ฅผ ์ฐ๋ฆฌ๋ ํผํด์ผ ํฉ๋๋ค.
โ ์ข์ Local Optimum ์ฐพ๊ธฐ
1. ์ข์ ์์ ์์ ์ ์ฐพ๋ ๋ฐฉ๋ฒ
์ข์ ์์ ์์ ์ ์ฐพ๋๋ค๋ฉด ๋ง์ฐฌ๊ฐ์ง๋ก ์ข์ local optimum์ ์ฐพ์ ์ ์์ต๋๋ค.
ํ์ง๋ง ์ด๋ฌํ ๋ฐฉ๋ฒ์ ๊ฑฐ์ ๋ถ๊ฐ๋ฅํ๋ค๊ณ ๋ณด์๋ฉด ๋ฉ๋๋ค.
2. ํ์ต ๋ฉ์ถ๊ธฐ
์ ๋นํ ํ์ต์ ํ๋ค๊ฐ loss์ ์ ๋๊ฐ์ด $\theta$๋ณด๋ค ์์์ง๋ค๋ฉด ํ์ต์ ๋ฉ์ถฅ๋๋ค.
์ฆ, Overfit์ ํ์ง ์๊ธฐ ์ํด (์ ์ข์ solution์ Overfit ํ ์ ์๊ธฐ ๋๋ฌธ) threshold๋ฅผ ์ ํ๋ ๊ฒ์ ๋๋ค.
3. Learning Curve ํ์ธํ๊ธฐ
Validation Error์ ๋ํ ๊ทธ๋ํ๋ฅผ ํตํด ์ ๋นํ ์์น์์ ํ์ต์ ์ข ๋ฃํ๋ ๋ฐฉ๋ฒ์ ๋๋ค.
์ง๊ธ๊น์ง ์ญ์ ํ ์๊ณ ๋ฆฌ์ฆ์ ๋ํด ํ์ตํ์ต๋๋ค.
์ฝ์ง ์์ ๋ด์ฉ์ด๋ผ์ ๋ง์ ๋ณต์ต์ด ํ์ํ ๊ฒ์ ๋๋ค.
'AI > Machine Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[ML] ํธ์ฆ์จ ๋จธ์ ๋ฌ๋ - 10(ํ์ ํด๋์ค API๋ก ๋์ ๋ชจ๋ธ ๋ง๋ค๊ธฐ) (0) | 2023.01.03 |
---|---|
[ML] ํธ์ฆ์จ ๋จธ์ ๋ฌ๋ - 10์ฅ(๋ค์ํ ๋ชจ๋ธ ๋ง๋ค๊ธฐ) (0) | 2023.01.03 |
[ML] Neural Network(5) - ์ญ์ ํ(Backpropagation)(1) (0) | 2022.12.06 |
[ML] Neural Network(4) - ์์ ํ(Feedforward Process) (0) | 2022.12.01 |
[ML] Neural Network(3) - MLP(Multilayer Perceptron) (0) | 2022.12.01 |