AI
[ML] 베이지안 분류기(Bayesian Classifier)(3) - Parameter Estimation
🤔Parameter Estimation 모수(parameter)은 모집단의 특성을 나타내는 수치로 모평균, 모분산, 모표준편차, 모비율, 모상관관계 등이 있습니다. 표본 통계량(sample statistics)은 표본(sample)의 특성을 나타내는 수치로 표본평균, 표본분산, 표본표준편차, 표본비율, 표본상관관계 등이 있습니다. 표본 통계량은 표본에서 얻은 모수에 대한 정보의 요약이므로 통계량은 모집단에서 추출한 특정 표본에 따라 달라지는 확률변수입니다. 이 통계량의 확률 분포를 표본 분포(sampling distribution)라고 부릅니다. 현실적으로 모집단의 특성, 즉 모수를 아는 것은 거의 불가능합니다. 따라서 표본의 특성인 통계량을 통해 모수를 추정(estimation)합니다. 이번 포스팅에서..
[ML] 베이지안 분류기(Bayesian Classifier)(2) - 베이즈 정리(Bayes' Theorem)
🤔베이즈 정리 저번 시간에 간단한 예시를 통해 베이지안 분류기를 배웠습니다. 그리고 결론적으로 아래의 식을 유도하여 대소관계의 비교를 통해 큰 확률을 가지는 값을 것을 알 수 있었습니다. $$P(w_j|x) (x : data, w_j : j^{th}class)$$ 이번 포스팅에서는 베이즈 정리에 대하여 수학적 유도를 통해 어떤 원리가 숨어있는지 이해하는 시간을 가져보도록 하겠습니다. 👉 이전 포스팅 더보기 https://2t-hong.tistory.com/64 [ML] 베이지안 분류기(Bayesian Classifier) 알아보기 🤔Bayesian Classifier 베이지안 분류기는 특성들 사이의 독립을 가정하는 베이즈 정리를 적용한 확률 분류기의 일정입니다. 이번 포스팅에서는 베이즈 정리에 대해 수학..
[ML] 베이지안 분류기(Bayesian Classifier)(1) - 알아보기
🤔Bayesian Classifier 베이지안 분류기는 특성들 사이의 독립을 가정하는 베이즈 정리를 적용한 확률 분류기의 일정입니다. 이번 포스팅에서는 베이즈 정리에 대해 수학적으로 알아보고 베이지안 분류기의 특성에 대해 알아보겠습니다. 🔎 Introduction 연어(Salmon) - 농어(Sea Bass) Problem이라는 꽤 유명한 예제를 통해 분류에 대해 먼저 알아보겠습니다. 어부가 바다에서 물고기를 잡았는데 연어와 농어 두 종류의 물고기가 잡혔습니다. 물고기를 더 좋은 값에 팔기 위해 어부는 물고기를 연어와 농어 각각을 종류별로 나누어야 합니다. 이때 물고기를 분류하는 방법에는 사람의 노력을 통해 직접 분류하는 것과 자동화 시스템을 통해서 분류하는 두 가지 방법이 있습니다. 위의 예시처럼 두 ..
[ML] NumPy & Pandas
🤔 NumPy & Pandas NumPy와 Pandas는 머신러닝을 공부한다면 절대 빠질 수 없는 필수 라이브러리입니다. 많은 사람들이 Numpy와 Pandas에 대한 설명을 해두었고 앞으로 공부할 내용에서도 많이 사용할 것이므로 간단하게 코드로 설명하고 넘어가겠습니다. 🔎 NumPy NumPy는 수학적인 연산 및 다차원 배열 (Array, Matrix, Tensor)의 연산을 가능하게 해주는 Python의 Library입니다. 아래는 NumPy를 사용한 예시입니다. In []: from google.colab import drive drive.mount('/content/drive') Mounted at /content/drive In [ ]: import numpy as np In [ ]: pytho..
[AI] 자연어 처리 - 단어의 표현(2)
🤔 단어의 의미 파악 단어의 의미를 파악하기 위한 기법들에는 아래 세 가지의 기법이 있습니다. 시소러스 활용 기법 통계 기반 기법 추론 기반 기법 각각의 기법에 대해 알아보는 시간을 가져보도록 하겠습니다. 작성하기에 앞서 [ICT COG Academy] 인공지능 고급(언어)과정을 수강하며 복습을 위해 작성한 글임을 명시합니다. 🔎 시소러스 활용 기법 사람의 경우 단어의 이해를 위하여 "사전"을 활용합니다. 사전에 단어의 의미를 정의해 둔 후 사용합니다. 컴퓨터도 이렇게 할 수 있지 않을까? 라고 생각하여 시소러스 활용 기법이 생겨났습니다. 시소러스란 유의어 사전, 어휘 분류 사전입니다. 즉 뜻이 같은 단어(동의어), 뜻이 비슷한 단어(유의어)가 한 그룹으로 분류되어 있는 사전입니다. car = auto ..