[AI] 군집화 알고리즘과 단순 베이즈 분류기CS/Artificial Intelligence2023. 11. 27. 01:32
Table of Contents
우선 군집화가 뭐였나요?
유사한 데이터끼리 모으는 것을 군집화 라고 합니다.
군집화는 다음과 같은 종류가 있습니다.
- 계층적 군집화: 군집들이 계층적인 구조를 가지도록 합니다.
- 병합형 계층적 군집화
하나의 데이터로 출발하여, 가까운 것을 결합해 나가며 계층구조를 생성합니다. Bottom-Up 방식이라고 볼 수 있습니다. - 분리형 계층적 군집화
전체 데이터를 가지는 하나의 군집에서 출발하여, 유사성을 바탕으로 군집을 분리합니다.
- 병합형 계층적 군집화
- 분할 군집화: 계층 구조를 맏늘지 않고, 전체 데이터를 유사한 것들끼리 나눠서 묶습니다.
- ex) K-means 알고리즘
- 분산값 V를 최소로 하는 점의 집합을 찾는 것이 목표입니다.
- 1. 초기에 군집의 중심을 임의로 설정해줍니다. (K개 설정)
- 2. 모든 점들에 대해, 가장 가까운 U(군집)을 찾아 배당해줍니다.
- 3. 각 군집의 중심(U)을 그 군집의 중심으로 재설정해주고, 수렴할 때 까지 2,3번 과정을 반복합니다.
그리고, 단순 베이즈 분류기에 대해 알아봅시다.
학습 데이터의 확률적인 분포를 학습하여, 분류기를 만들 수 있습니다.
분류기는, 주어진 데이터 X가, 특정 클래스 c에 속할 확률인 조건부 확률
P(c|X)
를 계산하는데, 이 때 베이즈 정리를 활용합니다.
상단 테이블은 전체 데이터의 집합을 나타내고
하단의 손글씨는,
데이터 X의 속성값이 "수직", "점선", "무" 라면, 해당 데이터는 삼각형일까? 사각형일까?
를 판단할 때, 가장 단순한 베이즈 분류기가 판단하게 되는 과정을 풀이한 것입니다.
간략하게 작성했으니, 직관적으로 이해가 갈 것이라 생각합니다.
첨언하자면, 단순 베이즈 분류기는
어떤 분류기에 대한 성능 판단의 지표가 되기도 하는데요.
통상 해당 분류기가 단순 베이즈 분류기보다 성능이 못하다면, 의미가 없다고 간주하게 됩니다.
공부에 도움이 되었으면 좋겠네요.
'CS > Artificial Intelligence' 카테고리의 다른 글
[AI] 드디어 이해한 신경망, 퍼셉트론, 다층 퍼셉트론, RBF 망 (0) | 2023.11.27 |
---|---|
[AI] Decision Tree, 엔트로피, 정보 이득, 정보이득비, 지니 지수 (1) | 2023.11.25 |
@찐빵1 :: 위기주도학습
포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!