무던히 하다보면 느는

[프로젝트] 본문

카테고리 없음

[프로젝트]

무던히 하다보면 느는 2022. 6. 19. 21:44

저번에 데이콘 대회를 참여하면서 NLI에 대해 공부했었던 적이 있다.

자연어 추론에 관한 대회였는데

premise와 hypothesis의 각각 한 문장씩 있고 그것이 참인지 거짓인지 중립인지 labeling 되어 있는

데이터를 예측하는 거다. (test 데이터에서의 premise - hypothesis 의 관계에 대해서 !)

 

근데 이걸 게임에도 접목시키다니 놀랍다. 이렇게 다 연결 되는거구나.. 하고 배운다

(굳이 따지자면 NLI가 아닌 다른 자연어 추론이겠지만! 🤠)

 

아무튼

 

EMBEDING -> CONVOLUTION (수백개의 필터로 다양한 특성 추출)

POOLING 가장 특징적인 특징만 남격놓고 나머지는 버린다

 

POOLING이 필요한 이유
  • 불필요한 부분 버리기 (노이즈 줄이기)
  • 텍스트 길이와 상관없이 같은 개수의 특성 뽑기

마지막_출력 레이어 : 특성들을 바탕으로 텍스트가 욕설일 확률 계산

 

정확도 비교.. (Accuracy 기준)

 

모델 해석

모델 해설 필요한 이유

  • 신뢰성 (모델의 판단 근거가 믿을 만한지)
  • 디버깅 (모델이 왜 잘못된 판단을 했는지)
  • 마스킹 (야 이 ㅄ아 -> 야 이 **아)

ㅋㅋ

 

호오... 문맥도 구분하는군

 

프로토타입 > 고도화

 

active learning

vdcnn (very deep cnn)

 

24:11

 

모델이 깊어져도 학습이 잘 이루어지도록

=> Shortcut Connection

 

25:14 ~ 오옹..

 

attention

🙄🙄😲👋