파이썬
[파이썬/Python] 비지도학습
무던히 하다보면 느는
2022. 7. 13. 21:43
제공 데이터
train - 레이블 없음 (features 데이터에 정상, 사기 데이터 섞여 있음.)
validation - 레이블 있음 (features 데이터에 정상, 사기 데이터 섞여 있음.)
test - 당연히 레이블 없음 (features 데이터에 정상, 사기 데이터 섞여 있음.)
사기 데이터는 정상 데이터 대비 0.01 %... 너무 적음..😡
❌ val dataset을 모델에 넣고 학습 시키면 안됨
레이블 없이 학습시키는 모델
비지도 학습
- PCA
- Fast-MCD
- 아이솔레이션 포레스트
- LOF
- one-class SVM
(핸즈온 머신러닝 2판 p.344)
고른 알고리즘명
- 아이솔레이션포레스트 - 오토인코더 - T-SNE |
오토인코더로 거의 98% 확신하고 진행하고 있음
아이솔레이션포레스트는 정확도는 높지만 정밀도와 재현율은 낮게 나옴.
f1 score 역시 낮음