1. 정의
데이터를 기반으로 모델을 학습하여 예측이나 분류 등의 작업을 수행하게 하는 기술
2. 기존 프로그래밍과의 차이
전통적 프로그래밍 : 규칙을 명시적으로 코딩한다
머신러닝 : 데이터를 제공하여 스스로 규칙을 학습한다
3. 세가지 종류
3.1. 지도학습
정답이 있는 문제 풀기
입력 : 문제 (X)
출력 : 정답 (Y)
예시
1. 아파트 면적(X)을 보고 가격(Y)을 예측
2. 이메일 내용을 보고 스팸인지 아닌지 분류
종류
1. 회귀 : 숫자 예측
2. 분류 : 카테고리 분류
3.2. 비지도 학습
정답없이 숨은 패턴 찾기
예시
1. 쇼핑몰에서 사람들의 구매 데이터를 보고, 비슷한 취향의 고객그룹을 찾기
2. 학생들을 시험 점수로 묶어 상위/중위/하위 자동 분류
3.3. 강화 학습
시도 - 결과 - 보상 - 학습 반복
컴퓨터가 게임처럼 반복하며 시행착오를 통해 점점 잘하게 되는 것
예시
1. 알파고 바둑
2. 로봇이 벽에 부딪히면 -1점, 목적지에 도달하면 +10점 → 점점 더 잘 움직이게 됨
4. 머신러닝 구성 요소
특징(Features) : 입력 데이터의 속성
레이블(Label) : 정답
샘플(Sample) : 입력 데이터 1개 단위
5. 머신러닝 과정 요약
1. 데이터 수집
2. 데이터 분할 : 학습용 (train) / 테스트용 (test) – 보통 80:20 또는 70:30
3. 모델 선택 : 선형 모델, SVM, 신경망 등
4. 학습 (Training) : 모델을 데이터에 적합하게 학습
5. 평가 (Evaluation) : 테스트 데이터를 이용하여 성능 확인
6. 예측 (Prediction) : 실제 사용 상황에서 입력에 대한 출력 예측
6. 머신 러닝 평가 지표
정확도(Accuracy) : 전체 예측 중 맞춘 비율
혼동 행렬(Confusion Matrix)
- TP (True Positive): 정답을 정답으로 맞춤
- TN (True Negative): 오답을 오답으로 맞춤
- FP (False Positive): 오답을 정답으로 예측
- FN (False Negative): 정답을 오답으로 예측
7. 주요 알고리즘
- kNN (k-최근접 이웃)
- SVM (서포트 벡터 머신)
- 신경망 (Neural Network)
- 의사결정트리 (Decision Tree)
'CS > AI' 카테고리의 다른 글
kNN(k-Nearest Neighbor) 알고리즘 (0) | 2025.06.09 |
---|---|
선형 회귀(Linear Regression) (0) | 2025.06.08 |
Convolutional Neural Network : CNN (0) | 2025.06.02 |