About Me/AI Tech

[Week 13- Day 5] 회고

green_ne 2022. 4. 16. 01:54

#

가이드라인 작성

추가로 계속 데이터 라벨링하면서, QA에 필요한 부분 정리하여 제출 했다. 이제 주말동안 계속 라벨링 해야 할 것 같다.

아침부터 Tagtog에 계속 파일이 안올라가서 local에서만 작업했다. (다른 annotation tool이 없을까?)

 

 

# 캐글 스터디- KLUE 대회 솔루션 정리

캐글스터디_NLP_KLUE_대회_김현아.pptx
5.09MB

- CV 트랙의 경우, nn dection이 대표적인 라이브러리

- entity embedding을 넣어주면, 추가로 weight를 넣어주니 행렬 분해가 일어나서 성능 향상

- 추천 트랙의 경우, user table과 item table을 이렇게 2개의 상호작용을 학습하면서 유사도가 높은 것을 추천

AutoEncoder기반 Transformer기반에 따라 모델의 학습 양상이 완전히 다름

- robust하다 = 일반화 성능이 좋다

- 내적 x 내적 = item들 간의 유사도 계산

- 긍정(더 긍정) - 부정(더 부정) = 1에 가까워지게 학습

순위 정보만이 주어질 때 prob 계산, 1/n으로 역수를 취해서 수행

- seed 변경 + over-fitting model + ensemble 로 성능 향상한 경우도 봤다

 

====> 스토리텔링 && 시행착오가 추가되면 좋을 것 같다!

 

## 피드백

스터디에서 KLUE 발표를 하기 위해 ppt 정리 및 발표 준비를 했었다. 하기 직전에 2번 정도 연습해보는 게 긴장을 풀리게 하는 데 도움이 된 것 같다.

방금 Tagtog 들어가서 업로드한 걸 보니 이제 되는 듯하다. 앞으로 여기서 작업해야지.

 

요새 생각 정리가 안되고 복잡한 상태인 것 같다.

이렇게 생각이 많아지고 내게 응원해주고 싶을 때는 ! " 1년 뒤의 나에게 예약 메일 보내기 " 추천한다고 한다.

 

 

 

 

 

 

 

반응형