파이썬

[파이썬/Python] 비지도학습

무던히 하다보면 느는 2022. 7. 13. 21:43

제공 데이터

train - 레이블 없음 (features 데이터에 정상, 사기 데이터 섞여 있음.)

validation - 레이블 있음 (features 데이터에 정상, 사기 데이터 섞여 있음.)

test - 당연히 레이블 없음 (features 데이터에 정상, 사기 데이터 섞여 있음.)

 

사기 데이터는 정상 데이터 대비 0.01 %... 너무 적음..😡

 

❌ val dataset을 모델에 넣고 학습 시키면 안됨

 

레이블 없이 학습시키는 모델

비지도 학습

- PCA

- Fast-MCD

- 아이솔레이션 포레스트

- LOF

- one-class SVM

(핸즈온 머신러닝 2판 p.344)

 

고른 알고리즘명

- 아이솔레이션포레스트
- 오토인코더
- T-SNE

오토인코더로 거의 98% 확신하고 진행하고 있음

아이솔레이션포레스트는 정확도는 높지만 정밀도와 재현율은 낮게 나옴.

f1 score 역시 낮음