๐คKNN(K - Nearest Neighors Classifier)
KNN์ด๋ ๋ง ๊ทธ๋๋ก K๊ฐ์ ๊ฐ์ฅ ๊ฐ๊น์ด ์ด์(๋ฐ์ดํฐ)๋ค์ ์ด์ฉํ์ฌ ๋ถ๋ฅ๋ฅผ ์งํํ๋ ๊ฒ์ ๋งํฉ๋๋ค.
๋งค์ฐ ๋จ์ํ ์๊ณ ๋ฆฌ์ฆ์ด์ง๋ง ์๊ฐ๋ณด๋ค ์ข์ ์ฑ๋ฅ์ ๋ด๊ธฐ ๋๋ฌธ์ ๋๋๊ณค๋ณผ์ ์ ํฌ๋ ฅ ์ธก์ ๊ธฐ์ ๊ฐ์ ์ญํ ์ ํฉ๋๋ค.
์ฆ, KNN์๊ณ ๋ฆฌ์ฆ๋ณด๋ค ์ข์ง ๋ชปํ ์ฑ๋ฅ์ ๋ด๋ ๋ชจ๋ธ๋ค์ ๋ฏฟ๊ณ ๊ฑธ๋ฌ์ฃผ์๋ฉด ๋ฉ๋๋ค.
์ด๋ฒ ํฌ์คํ ์์๋ KNN์ Normalization ์ ๋ํด ์์๋ณด๋๋ก ํ๊ฒ ์ต๋๋ค.
๐ ์ ๊ทํ(Normalization)
์ ๊ทํ ๋๋ ์ ์ํ(normalization)๋ ์ด๋ค ๋์์ ์ผ์ ํ ๊ท์น์ด๋ ๊ธฐ์ค์ ๋ฐ๋ฅด๋ ‘์ ๊ท์ ์ธ’ ์ํ๋ก ๋ฐ๊พธ๊ฑฐ๋, ๋น์ ์์ ์ธ ๋์์ ์ ์์ ์ผ๋ก ๋๋๋ฆฌ๋ ๊ณผ์ ์ ๋ปํฉ๋๋ค.
์ ๊ทํ์๋ z-normalization๊ณผ min-max normalizaition(scaling)์ด ์์ต๋๋ค.
โ๏ธ z-normalization
z normalization์ ํ๊ท ์ 0์ผ๋ก ๋ง์ถ๊ณ ๋จ์๋ฅผ ๋ถ์ฐ์ผ๋ก ๋ง์ถ๋ ๊ฒ์ ๋งํฉ๋๋ค.
์ด๋ฅผ ์์์ผ๋ก ํํํ๋ฉด ์๋์ ๊ฐ์ต๋๋ค.
z-normalization์ ๊ธฐ์ค์ 0์ ๋ง์ถ ์ ์๋ค๋ ์ ์ ๋๋ค.
๊ธฐ์ค์ 0์ ๋ง์ถ์์ ๋๋ ํด๋น ๊ฐ์ ํ๋ณํ๊ธฐ ์ฌ์์ง๋๋ค.
โ๏ธ min-max normalization(scaling)
min-max norm์ ํ๊ท ์ 1 ๋ถ์ฐ์ 1๋ก ๋ง๋ค์ด ์ฃผ๋ ๊ฒ์ ๋งํฉ๋๋ค.
์ด๋ฅผ ์์์ผ๋ก ๋ํ๋ด๋ฉด ์๋์ ๊ฐ์ต๋๋ค.
min-max norm์ ๊ฐ์ ๋ฒ์๊ฐ 0๋ถํฐ 1๊น์ง๋ผ๋ ์ฅ์ ์ด ์์ต๋๋ค.
์์๋ฅผ ๋ค์ด ๋ณด์๋ฉด ์๋์ ๊ฐ์ต๋๋ค.
'AI > Machine Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[ML] Ensemble Method(1) - ํธํฅ-๋ถ์ฐ ๋๋ ๋ง(Bias-Variance Dilemma) (0) | 2022.11.26 |
---|---|
[ML] Nearest Neighbor Method - KNN(3) (0) | 2022.11.11 |
[ML] Nearest Neighbor Method - Distance Metric(1) (0) | 2022.11.11 |
[ML] Regression(ํ๊ท)(3) - Logistic Regression(๋ก์ง์คํฑ ํ๊ท) (0) | 2022.11.11 |
[ML] Regression(ํ๊ท)(2) - Model Evaluation(๋ชจ๋ธ ํ๊ฐ) (0) | 2022.11.11 |