[Week 13- Day 5] 회고
#
가이드라인 작성
추가로 계속 데이터 라벨링하면서, QA에 필요한 부분 정리하여 제출 했다. 이제 주말동안 계속 라벨링 해야 할 것 같다.
아침부터 Tagtog에 계속 파일이 안올라가서 local에서만 작업했다. (다른 annotation tool이 없을까?)
# 캐글 스터디- KLUE 대회 솔루션 정리
- CV 트랙의 경우, nn dection이 대표적인 라이브러리
- entity embedding을 넣어주면, 추가로 weight를 넣어주니 행렬 분해가 일어나서 성능 향상
- 추천 트랙의 경우, user table과 item table을 이렇게 2개의 상호작용을 학습하면서 유사도가 높은 것을 추천
AutoEncoder기반 Transformer기반에 따라 모델의 학습 양상이 완전히 다름
- robust하다 = 일반화 성능이 좋다
- 내적 x 내적 = item들 간의 유사도 계산
- 긍정(더 긍정) - 부정(더 부정) = 1에 가까워지게 학습
순위 정보만이 주어질 때 prob 계산, 1/n으로 역수를 취해서 수행
- seed 변경 + over-fitting model + ensemble 로 성능 향상한 경우도 봤다
====> 스토리텔링 && 시행착오가 추가되면 좋을 것 같다!
## 피드백
스터디에서 KLUE 발표를 하기 위해 ppt 정리 및 발표 준비를 했었다. 하기 직전에 2번 정도 연습해보는 게 긴장을 풀리게 하는 데 도움이 된 것 같다.
방금 Tagtog 들어가서 업로드한 걸 보니 이제 되는 듯하다. 앞으로 여기서 작업해야지.
요새 생각 정리가 안되고 복잡한 상태인 것 같다.
이렇게 생각이 많아지고 내게 응원해주고 싶을 때는 ! " 1년 뒤의 나에게 예약 메일 보내기 " 추천한다고 한다.