๐คParameter Estimation
๋ชจ์(parameter)์ ๋ชจ์ง๋จ์ ํน์ฑ์ ๋ํ๋ด๋ ์์น๋ก ๋ชจํ๊ท , ๋ชจ๋ถ์ฐ, ๋ชจํ์คํธ์ฐจ, ๋ชจ๋น์จ, ๋ชจ์๊ด๊ด๊ณ ๋ฑ์ด ์์ต๋๋ค.
ํ๋ณธ ํต๊ณ๋(sample statistics)์ ํ๋ณธ(sample)์ ํน์ฑ์ ๋ํ๋ด๋ ์์น๋ก ํ๋ณธํ๊ท , ํ๋ณธ๋ถ์ฐ, ํ๋ณธํ์คํธ์ฐจ, ํ๋ณธ๋น์จ, ํ๋ณธ์๊ด๊ด๊ณ ๋ฑ์ด ์์ต๋๋ค.
ํ๋ณธ ํต๊ณ๋์ ํ๋ณธ์์ ์ป์ ๋ชจ์์ ๋ํ ์ ๋ณด์ ์์ฝ์ด๋ฏ๋ก ํต๊ณ๋์ ๋ชจ์ง๋จ์์ ์ถ์ถํ ํน์ ํ๋ณธ์ ๋ฐ๋ผ ๋ฌ๋ผ์ง๋ ํ๋ฅ ๋ณ์์ ๋๋ค.
์ด ํต๊ณ๋์ ํ๋ฅ ๋ถํฌ๋ฅผ ํ๋ณธ ๋ถํฌ(sampling distribution)๋ผ๊ณ ๋ถ๋ฆ ๋๋ค.
ํ์ค์ ์ผ๋ก ๋ชจ์ง๋จ์ ํน์ฑ, ์ฆ ๋ชจ์๋ฅผ ์๋ ๊ฒ์ ๊ฑฐ์ ๋ถ๊ฐ๋ฅํฉ๋๋ค.
๋ฐ๋ผ์ ํ๋ณธ์ ํน์ฑ์ธ ํต๊ณ๋์ ํตํด ๋ชจ์๋ฅผ ์ถ์ (estimation)ํฉ๋๋ค.
์ด๋ฒ ํฌ์คํ ์์๋ ๋ฒ ์ด์ง์ ๋ถ๋ฅ๊ธฐ์์ ๋ชจ์ ์ถ์ ์ ํ๋ ๋ฐฉ๋ฒ์ ๋ฐฐ์๋ณด๊ฒ ์ต๋๋ค.
๐ ์์ฑ๋ชจ๋ธ(Generative Model) vs ๋ถ๋ณ๋ชจ๋ธ(Discriminative Model)
โ๏ธ Generative Model
generative model์ด๋ ๋ฐ์ดํฐ $X$๊ฐ ์์ฑ๋๋ ๊ณผ์ ์ ๋ ๊ฐ์ ํ๋ฅ ๋ชจํ, ์ฆ $P(Y)$, $P(X|Y)$์ผ๋ก ์ ์ํ๊ณ , ๋ฒ ์ด์ฆ๋ฃฐ์ ์ฌ์ฉํด $P(Y|X)$๋ฅผ ๊ฐ์ ์ ์ผ๋ก ๋์ถํ๋ ๋ชจ๋ธ์ ๊ฐ๋ฆฌํต๋๋ค.
generative model์ ๋ ์ด๋ธ ์ ๋ณด๊ฐ ์์ด๋ ๋๊ณ , ์์ด๋ ๊ตฌ์ถํ ์ ์์ต๋๋ค.
์ ์๋ฅผ ์ง๋ํ์ต๊ธฐ๋ฐ์ generative model์ด๋ผ๊ณ ํ๋ฉฐ ์ ํํ๋ณ๋ถ์์ด ๋ํ์ ์ธ ์ฌ๋ก์ ๋๋ค.
ํ์๋ ๋น์ง๋ํ์ต ๊ธฐ๋ฐ์ generative model์ด๋ผ๊ณ ํ๋ฉฐ ๊ฐ์ฐ์์๋ฏน์ค์ฒ๋ชจ๋ธ, ํ ํฝ๋ชจ๋ธ๋ง์ด ๋ํ์ ์ธ ์ฌ๋ก์ ๋๋ค.
generative model์ discriminative model์ ๋นํด ๊ฐ์ ์ด ๋ง์ต๋๋ค.
๊ทธ ๊ฐ์ ์ด ์ค์ ํ์๊ณผ ๋ง์ง ์๋๋ค๋ฉด generative model์ ์ฑ๋ฅ์ discriminative model๋ณด๋ค ์ฑ๋ฅ์ด ์ข์ง ์์ ์ ์์ง๋ง, ๊ฐ์ ์ด ์ ๊ตฌ์ถ๋์ด ์๋ค๋ฉด ์ด์์น์๋ ๊ฐ๊ฑดํ๊ณ ํ์ต๋ฐ์ดํฐ๊ฐ ์ ์ ์ํฉ์์๋ ์ข์ ์์ธก ์ฑ๋ฅ์ ๋ณด์ผ ์ ์์ต๋๋ค.
generative model์ ๋ฒ์ฃผ์ ๋ถํฌ(distribution)์ ํ์ตํ๋ ๊ฒ์ด ๋ชฉํ๊ฐ ๋ฉ๋๋ค.
๋ํ generative model์ ์ผ๋ฐ์ ์ธ ๋ฒ ์ด์ง์ ์ถ๋ก ๊ณผ ๋ง์ฐฌ๊ฐ์ง๋ก ํ์ต๋ฐ์ดํฐ๊ฐ ๋ง์ ์๋ก discriminative model๊ณผ ๋น์ทํ ์ฑ๋ฅ์ผ๋ก ์๋ ดํ๋ ๊ฒฝํฅ์ด ์๋ค๊ณ ํฉ๋๋ค.
์์ธ๋ฌ generative model์ $P(X|Y)$์ ๊ตฌ์ถํ๊ธฐ ๋๋ฌธ์ ์ด ๋ชจ๋ธ์ ํ์ฉํด $X$๋ฅผ ์ํ๋งํ ์๋ ์์ต๋๋ค.
โ๏ธ Discriminative Model
Discriminative model์ด๋ ๋ฐ์ดํฐ $X$๊ฐ ์ฃผ์ด์ก์ ๋ ๋ ์ด๋ธ $Y$๊ฐ ๋ํ๋ ์กฐ๊ฑด๋ถํ๋ฅ $P(Y|X)$๋ฅผ ์ง์ ์ ์ผ๋ก ๋ฐํํ๋ ๋ชจ๋ธ์ ๊ฐ๋ฆฌํต๋๋ค.
๋ ์ด๋ธ ์ ๋ณด๊ฐ ์์ด์ผ ํ๊ธฐ ๋๋ฌธ์ ์ง๋ํ์ต(supervised learning) ๋ฒ์ฃผ์ ์ํ๋ฉฐ $X$์ ๋ ์ด๋ธ์ ์ ๊ตฌ๋ถํ๋ ๊ฒฐ์ ๊ฒฝ๊ณ(decision boundary)๋ฅผ ํ์ตํ๋ ๊ฒ์ด ๋ชฉํ๊ฐ ๋ฉ๋๋ค.
discriminative model์ generative model์ ๋นํด ๊ฐ์ ์ด ๋จ์ํ๊ณ , ํ์ต๋ฐ์ดํฐ ์์ด ์ถฉ๋ถํ๋ค๋ฉด ์ข์ ์ฑ๋ฅ์ ๋ด๋ ๊ฒ์ผ๋ก ์๋ ค์ ธ ์์ต๋๋ค.
์ ํํ๊ท์ ๋ก์ง์คํฑํ๊ท๋ disciminative model์ ๋ํ์ ์ธ ์์์ ๋๋ค.
โ๏ธ ์ฐจ์ด
๋ค์ ๊ทธ๋ฆผ์ generative model๊ณผ discriminative model๊ฐ์ ์ฐจ์ด๋ฅผ ๋ํ๋ธ ๊ทธ๋ฆผ์ ๋๋ค.
๊ทธ๋ฆผ์์ ์ ์ ์๋ฏ generative model์ ์ฌํํ๋ฅ ์ ๊ฐ์ ์ ์ผ๋ก ๋ํ๋ด๊ณ discriminative model์ ์ง์ ์ ์ผ๋ก ๋์ถํฉ๋๋ค.
์ฌํํ๋ฅ ์ ๋ํ ์ ๋ณด๋ ์ด์ ํฌ์คํธ๋ฅผ ํ์ธํ์๋ฉด ๋ฉ๋๋ค.
๋ํ ์๋์ ๊ทธ๋ฆผ๊ณผ ๊ฐ์ด generative model์ ๋ฐ์ดํฐ ๋ฒ์ฃผ์ ๋ถํฌ๋ฅผ, discriminative model์ ๊ฒฐ์ ๊ฒฝ๊ณ(Decision Boundary)๋ฅผ ํ์ตํฉ๋๋ค.
๐ Parametric vs Non-parametric
parametric๊ณผ Non-parametric์ ๋ชจ์(parameter)๋ฅผ ํ์๋ก ํ๋๊ฐ, ํ์๋ก ํ์ง ์๋ ๊ฐ์ ๋ฐ๋ผ ๊ตฌ๋ถํฉ๋๋ค.
๊ฐ๊ฐ์ ์์ธํ ์ดํด๋ณด๊ฒ ์ต๋๋ค.
โ๏ธ Parametric Model
ํ๋ผ๋ฏธํฐ ์๊ฐ ์ ํด์ ธ ์๋ ๋ชจ๋ธ์ ์๋ฏธํฉ๋๋ค.
์ฆ, ๋ฐ์ดํฐ๊ฐ ํน์ ๋ถํฌ๋ฅผ ๋ฐ๋ฅธ๋ค๊ณ ๊ฐ์ ํ๊ณ ํ์ต์ ํ๋ฉด์ ๊ฒฐ์ ํด์ผ ํ๋ ๋ถํฌ์ parameter ์ข ๋ฅ์ ์๊ฐ ๋ช ํํ๊ฒ ์ ํด์ ธ ์์ต๋๋ค.
๋ฐ์ดํฐ์ ์์ ๋ฐ๋ผ parameter์ ์๊ฐ ๋ณํ์ง ์์์ ์๋ฏธํฉ๋๋ค.
๋ฐ๋ผ์ parametric modell์ model์ ํํ๋ฅผ ์ ํ๊ณ , ์ด model์ parameter๋ฅผ ํ์ต์ ํตํด ๋ฐ์ ์ํค๋ ์๊ณ ๋ฆฌ์ฆ์ ๋๋ค.
๋ฐ์ดํฐ๊ฐ ๋ง์ ์๋ก ์ ํ๋๊ฐ ์ฌ๋ผ๊ฐ๋ค๋ ํน์ง์ด ์์ต๋๋ค.
์์๋ก ์ง๊ธ ๊ณต๋ถํ๊ณ ์๋ Bayesian ๋ชจ๋ธ์ด ์์ต๋๋ค.
์ด์ธ์๋ linear regression, logistic regression, neural network ๋ฑ์ด ์์ต๋๋ค.
โ๏ธ Non-parametric Model
ํ๋ผ๋ฏธํฐ์ ์๊ฐ ํ์ต ๋ฐ์ดํฐ์ ํฌ๊ธฐ์ ๋ฐ๋ผ ๋ฌ๋ผ์ง๋ ๋ชจ๋ธ์ ๋งํฉ๋๋ค.
์ฆ, ๋ฐ์ดํฐ๊ฐ ํน์ ๋ถํฌ๋ฅผ ๋ฐ๋ฅธ๋ค๋ ๊ฐ์ ์ด ์๊ธฐ ๋๋ฌธ์ ํ์ต์ ๋ฐ๋ผ tuningํด์ผ ํ parameter๊ฐ ๋ช ํํ ์ ํด์ ธ ์์ง ์์ต๋๋ค.
๋ฐ๋ผ์ non-parametric model์ ๋ flexibleํ๋ฉฐ, ๋ฐ์ดํฐ์ ๋ํ ์ฌ์ ์ง์์ด ์ ํ ์์ ๋ ์ ์ฉํ๊ฒ ์ฌ์ฉ๋ฉ๋๋ค.
์๋๊ฐ ๋๋ฆฌ๊ณ ๋ง์ ๋ฐ์ดํฐ๋ฅผ ํ์๋ก ํ์ง ์์ผ๋ฉฐ, ๋ชจ๋ธ์ ํํ์ ๋ํ ๋ช ํํ ์ค๋ช ์ด ์ด๋ ต์ต๋๋ค.
๐ Discriminant Function for Decision Boundary
โ๏ธ๊ฒฐ์ ๊ฒฝ๊ณ(Decision Boundary)
๊ฒฐ์ ๊ฒฐ๊ณ์ ๋ง๋ค๊ธฐ ์ํด $g_i(x)$๋ฅผ ์ ์ธํฉ๋๋ค.
๊ฐ๊ฐ์ ํด๋์ค์ ๋ํด $g_i(x) = P(w_i|x) = P(x|w_i)P(w_i)$๋ผ๊ณ ํ๊ฒ ์ต๋๋ค.
์ด๋ ๊ฒฐ์ ๊ฒฝ๊ณ๋ฅผ ์ฐพ์ผ๋ ค๊ณ ํ๊ธฐ ๋๋ฌธ์ ๋น๊ต๋ฅผ ์งํํด์ผ ํฉ๋๋ค.
๋น๊ต์ ์์ด ๊ฐ ํญ์ log๋ฅผ ์ทจํด์ฃผ๋๋ผ๋ ๋น๊ต์๋ ์ํฅ์ ๋ผ์น์ง ๋ชปํ๊ธฐ ๋๋ฌธ์ log๋ฅผ ์ทจํด์ฃผ๋๋ผ๋ ์๊ด์์ต๋๋ค.
์ด๋ $g_i(x) = lnP(x|w_i) + lnP(w_i)$์ด๋ผ๋ ์์ ๋์ถ ํ ์ ์์ต๋๋ค.
๊ฒฐ์ ๊ฒฝ๊ณ๋ $g_1(x) = g_2(x)$์์ ์ฐพ์ ์ ์์ต๋๋ค.
์ฆ, $g(x) = g_1(x) - g_2(x) = 0$์ผ ๋ ๊ฒฐ์ ๊ฒฝ๊ณ๋ฅผ ์ฐพ์ ์ ์์ต๋๋ค.
์์ ์์์ $lnP(x|w_i)$๋ ๋ฐ์ดํฐ๋ก๋ถํฐ ์ฐพ์๋ผ ์ ์๊ณ $lnP(w_i)$๋ ์ฌ์ ์ ์๊ณ ์์ต๋๋ค.
๊ทธ๋ฌ๋ฏ๋ก ์์ ์์ ํตํด ๊ฒฐ์ ๊ฒฝ๊ณ๋ฅผ ์ฐพ์ ์ ์์ต๋๋ค.
โ๏ธ๊ฐ์ฐ์์ ์ ๊ท๋ถํฌ(Gaussian Distribution)
๊ฐ์ฐ์์ ์ ๊ท๋ถํฌ๋ $1$์ฐจ์ ํํ์ $d$์ฐจ์์ธ ๊ฒฝ์ฐ๋ฅผ ๊ตฌ๋ถํ์ฌ ์์ผ๋ก ๋ํ๋ผ ์ ์์ต๋๋ค.
๊ฐ์ฐ์์ ์ ๊ท๋ถํฌ๊ฐ $1$์ฐจ์ ํํ์ธ ๊ฒฝ์ฐ ๋จ๋ณ๋(univariate) ๊ฐ์ฐ์์์ด๋ผ๊ณ ํ๊ณ , ๊ฐ์ฐ์์ ์ ๊ท๋ถํฌ๊ฐ $d$์ฐจ์ ํํ์ธ ๊ฒฝ์ฐ ๋ค๋ณ๋(multivariate) ๊ฐ์ฐ์์์ด๋ผ๊ณ ํฉ๋๋ค.
ํด๋น ๋ถํฌ๋ $N(μ,σ^2)$ ๋๋ $N(μ,Σ)$ํํ๋ก ํํํฉ๋๋ค.
๋จ๋ณ๋ ๊ฐ์ฐ์์ ๋ถํฌ๋ ์๋์ ๊ฐ์ด ๋ํ๋ผ ์ ์์ต๋๋ค.
๋ค๋ณ๋ ๊ฐ์ฐ์์ ๋ถํฌ๋ ์๋์ ๊ฐ์ด ๋ํ๋ผ ์ ์์ต๋๋ค.
์์์ ์ค๋ช ํ ๊ฒ๊ณผ ๊ฐ์ด ๊ฒฐ์ ๊ฒฝ๊ณ๋ $g_i(x) = lnP(x|w_i) + lnP(w_i)$์ ๊ฐ์ด ๋ํ๋ผ ์ ์์ต๋๋ค.
์ด๋ $lnP(x|w_i)$์ ๋ค๋ณ๋ ๊ฐ์ฐ์์ ๋ถํฌ๋ฅผ ๋์ ํฉ๋๋ค.
ํด๋น ์์ ์ ๋ฆฌํ๋ฉด ์๋์ ๊ฐ์ด ์ ๋ฆฌํ ์ ์์ต๋๋ค.
ํด๋น ์์ด ๋ณต์กํด ๋ณด์ด์ง๋ง ์ดํด๋ฅผ ์ํด ์๋ฏธ๋ฅผ ์ดํด๋ณด๊ฒ ์ต๋๋ค.
ํด๋น ์์์ ์ ๋ ฅ์ ๋ฒกํฐ $x$์ ๋๋ค.
๋ํ ํด๋์ค ๋ณ ํ๊ท ๊ณผ ๋ฒกํฐ๋ $μ_i,Σ_i$์์ ์ ์ ์์ต๋๋ค.
์์๋ฅผ ๋ค์ด 2์ฐจ์ ์ค์ ๊ณต๊ฐ์ ์ ์๋ $x = (x_1, x_2)^T$์ ๋ํด ๋ค๋ค๋ณด๊ฒ ์ต๋๋ค.
์ด ๋ ํด๋์ค $w_i$๋ ๋ค์ ์ฑ์ง์ ๋ฐ๋ฅธ๋ค๊ณ ๊ฐ์ ํ๊ฒ ์ต๋๋ค.
์์์ ์ ๊ฐํ ์์ ๋์ ์ ํ๋ฉด ์๋์ ๊ฐ์ด ์ ๋ฆฌํ ์ ์์ต๋๋ค.
ํด๋น ์์ 2์ฐจ์, 1์ฐจ์, ์์ํญ์ผ๋ก ์ ๋ฆฌ๋จ์ ์ ์ ์์ต๋๋ค.
์ฆ, ํน์ง ๋ฒกํฐ์ ์ฐจ์์ ๋ฐ๋ผ ๊ฐ์ ์ฐจ์์ผ๋ก ์ ๋ฆฌ๋จ์ ์ ์ ์์ต๋๋ค.
์ ์์ $w_i$์ ํด๋์ค์ ์ํ๋ ์ด๋ค ๊ฐ์ ๋ํ ์ฌํํ๋ฅ ์ ๋ปํฉ๋๋ค.
๊ทธ๋ ๊ธฐ ๋๋ฌธ์ ๋ ํด๋์ค $g_i(x), g_j(x)$์ ๋ํด ๊ฒฐ์ ๊ฒฝ๊ณ๋ฅผ ๋ํ๋ด๋ฉด ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
์กฐ๊ธ ๋ ๊น๊ฒ ํ๊ณ ๋ค๋ฉด ๊ฐ ํด๋์ค ๋ณ๋ก ๊ฐ์ ๊ณต๋ถ์ฐ์ ๊ฐ์ง๋ ๊ฒฝ์ฐ์ ๊ทธ๋ ์ง ์์ ๊ฒฝ์ฐ์ ๋ฐ๋ผ ํด์ ๋ฐฉ๋ฒ์ด ๋ค๋ฅธ๋ฐ, ์ด๋ ์๋์ ๋ธ๋ก๊ทธ๋ฅผ ์ฐธ๊ณ ํด์ฃผ์๋ฉด ๊ฐ์ฌํ๊ฒ ์ต๋๋ค.
์ฐ๋ฆฌ๊ฐ ์์๋ณผ ๊ฒ์ ๊ฐ์ฐ์์ ๋ถํฌ๋ฅผ ํตํด ํ๋ผ๋ฏธํฐ๋ค์ ์ด๋ป๊ฒ ์ถ์ ํ๋๊ฐ์ ๋ํด์ ์ ๋๋ค.
์ด๋ฅผ MLE(Maximum Likelihood Estimation)์ด๋ผ๊ณ ํ๋๋ฐ ๋ง ๊ทธ๋๋ก Likelihood์ ์ต๋๋ฅผ ์ฐพ๋ ๊ฒ์ด๋ฏ๋ก ๋ฏธ๋ถ์ ํด์ 0์ด ๋๋ ์ ์ ์ฐพ๋ ๊ฒ์ด๋ผ๊ณ ์ถ์ธกํด๋ณผ ์ ์์ต๋๋ค.
๐ MLE(Maximum Likelihood Estimation)
1ํ๊ธฐ ํ๋ฅ ๊ณผ ํต๊ณ ๊ณต๋ถ๋ฅผ ํ๋ฉฐ MLE์ ๋ํด ๋ฐฐ์ ๋๋ฐ ์ ๋ง ์ด์ฌํ ์ ๋ฆฌํ ๋ด์ฉ์ด ์์ด ์๋์ ๋ด์ฉ์ ์ดํด๋ณด์๋ฉด ์ข์ ๊ฒ ๊ฐ์ต๋๋ค.
๐ MLE ์ ๋ฆฌ
https://ttl-blog.tistory.com/651?category=925533
[ํ๋ฅ ๊ณผ ํต๊ณ] - (17) ์ต๋๊ฐ๋ฅ๋ ๋ฐฉ๋ฒ(์ต๋์ฐ๋๋ฒ) (Maximum Likelihood Estimator, MLE)
๊ฐ๋ฅ๋(Likehood) ๊ฐ๋ฅ๋๋ ์ฐ๋๋ผ๊ณ ๋ ๋ถ๋ฆฌ๋ฉฐ, ์ด๋ ํ ๊ฐ์ด ๊ด์ธก๋์์ ๋, ์ด ๊ฐ์ด ์ด๋ค ํ๋ฅ ๋ถํฌ๋ก๋ถํฐ ์์์ง์ ๋ํ ํ๋ฅ ์ ๋ํ๋ด๋ ๊ฐ์ ๋๋ค. ๊ฐ๋ฅ๋ ํจ์ (Likedhood Function) n๊ฐ์ ์์์ ํ
ttl-blog.tistory.com
์ฐ๋ฆฌ๊ฐ ์๊ณ ์ถ์ ๊ฒ์ ์ฃผ์ด์ง ๋ฐ์ดํฐ๋ฅผ ํตํด ํ๋ฅ ํจ์๋ฅผ ์ต๋ํํ๋ parameter์ ์ถ์ ํ๋ ๊ฒ์ ๋๋ค.
์ฆ, Maximum Likelihood๋ฅผ ์ถ์ ํ๋ ๊ฒ์ ๋๋ค.
์๋์ ๊ฐ์ ๋ถํฌ๊ฐ ์กด์ฌํ ๋ ์๋์ ๊ณผ์ ์ ๊ฑฐ์ณ ์ฐพ๊ณ ์ํ๋ ๊ฐ์ ์ฐพ์ ์ ์์ต๋๋ค.
์์ ๊ทธ๋ํ์ ๊ฐ์ด ์ด๋ฅผ ์ํ์ ์ผ๋ก ์์ ํ๋ฉด ์ ์ฒด ํ๋ณธ์งํฉ์ ๊ฒฐํฉํ๋ฅ ๋ฐ๋ํจ์๋ฅผ Likelihood function์ด๋ผ๊ณ ํ ์ ์์ต๋๋ค.
ํด๋น ์์ ๊ฒฐ๊ณผ ๊ฐ์ด ๊ฐ์ฅ ์ปค์ง๋ $\theta$๋ฅผ ์ถ์ ๊ฐ $\hat{\theta}$๋ก ๋ณด๋ ๊ฒ์ด ๊ฐ์ฅ ๊ทธ๋ด ๋ฏ ํฉ๋๋ค.
๋ฏธ๋ถ์ด ์ฉ์ดํ๊ฒ ํ๊ธฐ ์ํด ์์ฐ๋ก๊ทธ๋ฅผ ์ทจํด Log-likelihood fuction $L(\theta|x)$๋ฅผ ์ด์ฉํฉ๋๋ค.
์ฐพ๊ณ ์ ํ๋ ํ๋ผ๋ฏธํฐ $\theta$์ ๋ํ์ฌ ๋ค์๊ณผ ๊ฐ์ด ํธ๋ฏธ๋ถ์ ์งํํ ๋ค ๊ทธ ๊ฐ์ด 0์ด ๋๋๋ก ํ๋ ๊ฐ์ ์ฐพ์ต๋๋ค.
์กฐ๊ธ ๋ generalํ case๋ก ๋ชจํ๊ท ๊ณผ ๋ชจ๋ถ์ฐ์ ์์ง ๋ชปํ ๋ MLE๋ฅผ ์ฐพ๋ ๋ฐฉ๋ฒ์ ์์์ผ ํ๋๋ฐ ์ด๋ ์๋์ ๋ธ๋ก๊ทธ๋ฅผ ์ฐธ๊ณ ํด์ฃผ์ธ์.
๐ General Case
์ง๊ธ๊น์ง Parameter Estimation์ ํ๋ ๋ฐฉ๋ฒ์ ๋ํด ์์๋ณด์์ต๋๋ค.
๋ค์ ํฌ์คํ ์์๋ Bayesian Classifier์ ์ถ๊ฐ ์ ๋ณด์ ๋ํด ์์๋ณด๊ฒ ์ต๋๋ค.
๐ Reference
๋ชจ์์ ํ๋ณธ ํต๊ณ๋(=๋ชจ์ ์ถ์ ์น)
๋ชจ์(parameter)๋ ๋ชจ์ง๋จ(population)์ ํน์ฑ์ ๋ํ๋ด๋ ์์น๋ก ๋ชจํ๊ท , ๋ชจ๋ถ์ฐ, ๋ชจํ์คํธ์ฐจ, ๋ชจ๋น์จ, ๋ชจ์๊ด๊ด๊ณ ๋ฑ์ด ์๋ค. ํ๋ณธ ํต๊ณ๋(sample statistics)์ ํ๋ณธ(sample)์ ํน์ฑ์ ๋ํ๋ด๋ ์์น๋ก ํ
bskyvision.com
https://ratsgo.github.io/generative%20model/2017/12/17/compare/
discriminative vs generative · ratsgo's blog
์ด๋ฒ ๊ธ์์๋ discriminative model๊ณผ generative model์ ๋น๊ตํด๋ณด๋๋ก ํ๊ฒ ์ต๋๋ค. ์ด ๊ธ์ ์ ์ธ์ ์์ธ๋ ๋ฐ์ฌ๊ณผ์ ์ด 2017๋ 12์์ ์งํํ ํจ์คํธ์บ ํผ์ค ๊ฐ์๋ฅผ ์ ๋ฆฌํ์์ ๋จผ์ ๋ฐํ๋๋ค. ๊ทธ๋ผ ์์ํ
ratsgo.github.io
https://gaussian37.github.io/ml-concept-gaussian_discriminant/
๊ฐ์ฐ์์ ๋ถํฌ์ ๋ถ๋ณ ํจ์ (์ ํ ๋ถ๋ณ ๋ถ์(LDA), 2์ฐจ ๋ถ๋ณ ๋ถ์(QDA))
gaussian37's blog
gaussian37.github.io
https://angeloyeo.github.io/2020/07/17/MLE.html
์ต๋์ฐ๋๋ฒ(MLE) - ๊ณต๋์ด์ ์ํ์ ๋ฆฌ๋ ธํธ
angeloyeo.github.io
'AI > Machine Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[ML] Regression(ํ๊ท)(1) - Linear Regression(์ ํ ํ๊ท) (0) | 2022.11.11 |
---|---|
[ML] ๋ฒ ์ด์ง์ ๋ถ๋ฅ๊ธฐ(Bayesian Classifier)(4) - Bayesian Classifier (0) | 2022.10.14 |
[ML] ๋ฒ ์ด์ง์ ๋ถ๋ฅ๊ธฐ(Bayesian Classifier)(2) - ๋ฒ ์ด์ฆ ์ ๋ฆฌ(Bayes' Theorem) (0) | 2022.10.14 |
[ML] ๋ฒ ์ด์ง์ ๋ถ๋ฅ๊ธฐ(Bayesian Classifier)(1) - ์์๋ณด๊ธฐ (0) | 2022.10.03 |
[ML] NumPy & Pandas (0) | 2022.09.19 |