๐คBayesian Classifier
๋ฒ ์ด์ง์ ๋ถ๋ฅ๊ธฐ๋ ํน์ฑ๋ค ์ฌ์ด์ ๋ ๋ฆฝ์ ๊ฐ์ ํ๋ ๋ฒ ์ด์ฆ ์ ๋ฆฌ๋ฅผ ์ ์ฉํ ํ๋ฅ ๋ถ๋ฅ๊ธฐ์ ์ผ์ ์ ๋๋ค.
์ด๋ฒ ํฌ์คํ ์์๋ ๋ฒ ์ด์ฆ ์ ๋ฆฌ์ ๋ํด ์ํ์ ์ผ๋ก ์์๋ณด๊ณ ๋ฒ ์ด์ง์ ๋ถ๋ฅ๊ธฐ์ ํน์ฑ์ ๋ํด ์์๋ณด๊ฒ ์ต๋๋ค.
๐ Introduction
์ฐ์ด(Salmon) - ๋์ด(Sea Bass) Problem์ด๋ผ๋ ๊ฝค ์ ๋ช ํ ์์ ๋ฅผ ํตํด ๋ถ๋ฅ์ ๋ํด ๋จผ์ ์์๋ณด๊ฒ ์ต๋๋ค.
์ด๋ถ๊ฐ ๋ฐ๋ค์์ ๋ฌผ๊ณ ๊ธฐ๋ฅผ ์ก์๋๋ฐ ์ฐ์ด์ ๋์ด ๋ ์ข ๋ฅ์ ๋ฌผ๊ณ ๊ธฐ๊ฐ ์กํ์ต๋๋ค.
๋ฌผ๊ณ ๊ธฐ๋ฅผ ๋ ์ข์ ๊ฐ์ ํ๊ธฐ ์ํด ์ด๋ถ๋ ๋ฌผ๊ณ ๊ธฐ๋ฅผ ์ฐ์ด์ ๋์ด ๊ฐ๊ฐ์ ์ข ๋ฅ๋ณ๋ก ๋๋์ด์ผ ํฉ๋๋ค.
์ด๋ ๋ฌผ๊ณ ๊ธฐ๋ฅผ ๋ถ๋ฅํ๋ ๋ฐฉ๋ฒ์๋ ์ฌ๋์ ๋ ธ๋ ฅ์ ํตํด ์ง์ ๋ถ๋ฅํ๋ ๊ฒ๊ณผ ์๋ํ ์์คํ ์ ํตํด์ ๋ถ๋ฅํ๋ ๋ ๊ฐ์ง ๋ฐฉ๋ฒ์ด ์์ต๋๋ค.
์์ ์์์ฒ๋ผ ๋ ๊ฐ์ง ์ข ๋ฅ์ ๋ถ๋ฅ๋ฅผ ํ๋ ๊ฒฝ์ฐ์๋ '2-Class Classification' ํน์ '์ด์ง๋ถ๋ฅ(Binary Class Classification)'์ด๋ผ๊ณ ํฉ๋๋ค.
์ฐ๋ฆฌ๋ ๊ธฐ๊ณํ์ต์ ๊ณต๋ถํ๋ ์ ์ฅ์ด๊ธฐ ๋๋ฌธ์ ์ฌ๋์ ๋ ธ๋ ฅ์ผ๋ก ๋ถ๋ฅํ๋ ๊ฒ์ ๋น์ฐํ ๊ด์ฌ์ด ์๊ฒ ์ฃ ?
์๋ํ ์์คํ ์ ํตํด ๋ฌผ๊ณ ๊ธฐ๋ฅผ ๋ถ๋ฅํ๊ธฐ์ํด์๋ ์นด๋ฉ๋ผ๋ฅผ ํตํด ๋ฌผ๊ณ ๊ธฐ์ ํน์ฑ(๊ธธ์ด, ๋ฐ๊ธฐ, ๋ฌด๊ฒ ๋ฑ)์ ํ์ ํด์ผํฉ๋๋ค.
๊ฐ๋จํ ๊ทธ๋ฆผ์ผ๋ก ๋ํ๋ด๋ฉด ์๋์ ๊ฐ์ต๋๋ค.
์ด๋ฌํ ๊ณผ์ ์ ํตํด ์ฐ๋ฆฌ๋ ๋๋์ ๋ฐ์ดํฐ๋ฅผ ๋ชจ์์ต๋๋ค.
์ด๋ฌํ ๋ฐ์ดํฐ๋ฅผ ๋ ๊ฐ์ ํน์ฑ(๋ณ์)๋ฅผ ํตํด ์๋์ ๊ฐ์ด ๊ทธ๋ํ๋ฅผ ๊ทธ๋ ค๋ณผ ์ ์์ต๋๋ค.
์ ๋ width ์ lightness๋ฅผ ๊ธฐ์ค์ผ๋ก ๊ทธ๋ํ๋ฅผ ๊ทธ๋ ธ์ต๋๋ค.
๊ฒ์์ ์ ์ด ์ฐ์ด๋ฅผ ์๋ฏธํ๊ณ ๋นจ๊ฐ์ ์ ์ ๋์ด๋ฅผ ์๋ฏธํฉ๋๋ค.
์ด๋ ๋ ๋ฌผ๊ณ ๊ธฐ๋ฅผ ์ ๋นํ๊ฒ ๋๋ ์ฃผ๋ ์ ์ ๊ทธ๋ฆฌ๋ฉด ์์ ๊ฐ์ต๋๋ค.
๊ทธ๋ํ์์ ์ ์ ์๋ ์ค๋ถ๋ฅ๋๋ ๊ฒฝ์ฐ๊ฐ ๋น์ฐํ ์๊ธธ ์ ์์ต๋๋ค.
ํด๋น ๊ทธ๋ํ์์ $x1$์ ์ฐ์ด $x2$๋ ๋์ด๋ฅผ ๋ํ๋ธ๋ค๊ณ ํ ๋ ๊ทธ๋ํ๋ฅผ ํ๋ก ๋ํ๋ด๋ฉด ์๋์ ๊ฐ์ ํํ๊ฐ ๋ ๊ฒ์ ๋๋ค.
์ฆ ๋ฐ์ดํฐ๋ฅผ ์ํ์ ํํ๋ก ๋ํ๋ธ ๊ฒ์ธ๋ฐ ์ค์ ์ธ๊ณ์ ์ด๋ฒคํธ๋ฅผ ๋ฒกํฐ์ ํํ๋ก ๋ํ๋ผ ์ ์์ต๋๋ค.
ํ ๋ง๋ฆฌ์ ๋ฌผ๊ณ ๊ธฐ๋ฅผ $X$๋ผ๊ณ ํ์ ๋ $X^T = [x_1, x_2]$๋ผ๊ณ ํ ์ ์์ต๋๋ค.(๋ฒกํฐ๋ column ์ด๋ฏ๋ก)
์ฐ๋ฆฌ๋ ๋๋์ ๋ฐ์ดํฐ๋ฅผ ์ป์์ผ๋ฏ๋ก ๋๋์ ๋ฐ์ดํฐ๋ฅผ $D$๋ผ๊ณ ํ์ ๋ ๋ฐ์ดํฐ๋ฅผ ์์ผ๋ฉด ํ๋ ฌ์ ํตํด ์์ ๊ฐ์ ํ๋ฅผ ๋ง๋ค ์ ์๋ ๊ฒ์ ๋๋ค.
์ด๋ฅผ ์์์ผ๋ก ๋ํ๋ด๋ฉด $D = [X_1^T, X_2^T, … , X_n^T]$์ ๊ฐ์ด ๋ํ๋ผ ์ ์์ต๋๋ค.
๐ ๋ฒ ์ด์ง์ ๋ถ๋ฅ๊ธฐ
์์ ์์๋ฅผ ํตํด ๋ฒ ์ด์ง์ ๋ถ๋ฅ๊ธฐ์ ๋ํด ์์๋ณด๊ฒ ์ต๋๋ค.
์ฐ๋ฆฌ๋ ๋ฐ์ดํฐ๋ฅผ ๋๊ฐ์ ํด๋์ค์ธ ๋์ด์ ์ฐ์ด๋ก ๋ถ๋ฅํ๋ ค๊ณ ํฉ๋๋ค.
์ฆ ์ฐ๋ฆฌ๊ฐ ์๊ณ ์ถ์ ๊ฒ์ $x$๋ผ๋ ๋ฐ์ดํฐ๊ฐ ์ฃผ์ด์ก์ ๋ ํด๋น ๋ฐ์ดํฐ๊ฐ ๋์ด์ธ์ง ์ฐ์ด์ธ์ง ๊ตฌ๋ถํ๋ ๊ฒ์ ๋๋ค.
์ด๋ฅผ ์์์ผ๋ก ๋ํ๋ด๋ฉด ์กฐ๊ฑด๋ถ ํ๋ฅ ์ ์ด์ฉํ์ฌ ์๋์ ๊ฐ์ด ๋ํ๋ผ ์ ์์ต๋๋ค.
$$P(w_j|x) (x : data, w_j : j^{th}class)$$
์ด๋ ์ฐ๋ฆฌ๋ ๋์ด์ ์ฐ์ด ๋ ๊ฐ์ง์ ํด๋์ค๋ง ๊ฐ์ง๊ณ ์์ผ๋ฏ๋ก $w_1$์ ๋์ด $w_2$๋ฅผ ์ฐ์ด๋ผ๊ณ ํ๊ฒ ์ต๋๋ค.
๊ทธ๋ ๋ค๋ฉด ์๋ฅผ ๋ค์ด $P(w_1|x) > P(w_2|x)$๋ผ๋ฉด ๋ฐ์ดํฐ $x$๋ ํด๋์ค 1์ธ ๋์ด๋ผ๊ณ ์๊ฐํ ์ ์์ต๋๋ค.
๋ค์ ํฌ์คํธ์์๋ ๋ฒ ์ด์ฆ ํจ์์ ๋ํด ์ํ์ ์ผ๋ก ์์๋ณด๋๋ก ํ๊ฒ ์ต๋๋ค.
https://zephyrus1111.tistory.com/79
'AI > Machine Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[ML] Regression(ํ๊ท)(1) - Linear Regression(์ ํ ํ๊ท) (0) | 2022.11.11 |
---|---|
[ML] ๋ฒ ์ด์ง์ ๋ถ๋ฅ๊ธฐ(Bayesian Classifier)(4) - Bayesian Classifier (0) | 2022.10.14 |
[ML] ๋ฒ ์ด์ง์ ๋ถ๋ฅ๊ธฐ(Bayesian Classifier)(3) - Parameter Estimation (0) | 2022.10.14 |
[ML] ๋ฒ ์ด์ง์ ๋ถ๋ฅ๊ธฐ(Bayesian Classifier)(2) - ๋ฒ ์ด์ฆ ์ ๋ฆฌ(Bayes' Theorem) (0) | 2022.10.14 |
[ML] NumPy & Pandas (0) | 2022.09.19 |