1. 정의

데이터를 기반으로 모델을 학습하여 예측이나 분류 등의 작업을 수행하게 하는 기술


2. 기존 프로그래밍과의 차이 

 

전통적 프로그래밍 : 규칙을 명시적으로 코딩한다

머신러닝 : 데이터를 제공하여 스스로 규칙을 학습한다

 


3. 세가지 종류

3.1. 지도학습

정답이 있는 문제 풀기

입력 : 문제 (X)

출력 : 정답 (Y)

 

예시

1. 아파트 면적(X)을 보고 가격(Y)을 예측

2. 이메일 내용을 보고 스팸인지 아닌지 분류

 

종류

1. 회귀 : 숫자 예측 

2. 분류 : 카테고리 분류

 

3.2. 비지도 학습

정답없이 숨은 패턴 찾기

 

예시 

1. 쇼핑몰에서 사람들의 구매 데이터를 보고, 비슷한 취향의 고객그룹을 찾기

2. 학생들을 시험 점수로 묶어 상위/중위/하위 자동 분류

 

3.3. 강화 학습

시도 - 결과 - 보상 - 학습 반복

컴퓨터가 게임처럼 반복하며 시행착오를 통해 점점 잘하게 되는 것 

 

예시

1. 알파고 바둑

2. 로봇이 벽에 부딪히면 -1점, 목적지에 도달하면 +10점 → 점점 더 잘 움직이게 됨

 


4. 머신러닝 구성 요소

특징(Features) : 입력 데이터의 속성

레이블(Label) : 정답

샘플(Sample) : 입력 데이터 1개 단위 


5. 머신러닝 과정 요약 

1. 데이터 수집
2. 데이터 분할 : 학습용 (train) / 테스트용 (test) – 보통 80:20 또는 70:30
3. 모델 선택 : 선형 모델, SVM, 신경망 등
4. 학습 (Training) : 모델을 데이터에 적합하게 학습
5. 평가 (Evaluation) : 테스트 데이터를 이용하여 성능 확인
6. 예측 (Prediction) : 실제 사용 상황에서 입력에 대한 출력 예측

 


6. 머신 러닝 평가 지표

정확도(Accuracy) : 전체 예측 중 맞춘 비율

 

혼동 행렬(Confusion Matrix)
 - TP (True Positive): 정답을 정답으로 맞춤

 - TN (True Negative): 오답을 오답으로 맞춤

 - FP (False Positive): 오답을 정답으로 예측

 - FN (False Negative): 정답을 오답으로 예측

 


7. 주요 알고리즘

- kNN (k-최근접 이웃)
- SVM (서포트 벡터 머신)
- 신경망 (Neural Network)
- 의사결정트리 (Decision Tree)

 

 

반응형

'CS > AI' 카테고리의 다른 글

kNN(k-Nearest Neighbor) 알고리즘  (0) 2025.06.09
선형 회귀(Linear Regression)  (0) 2025.06.08
Convolutional Neural Network : CNN  (0) 2025.06.02

+ Recent posts