[Week 7- Day 5] 회고

About Me/AI Tech

[Week 7- Day 5] 회고

green_ne 2022. 3. 5. 16:47

# 이미지 분류 대회 동안 실험한 내용

2022.02.21 ~ 2022.03.03 실험 기록

resnet18로 하이퍼파라미터를 튜닝하다가, 위와 같이 focal loss & adam optmizer 일 때 과대적합 되지 않으면서 좋은 점수를 만났다. (+ normalize transform)
이후 weight freeze한 vgg16_bn에 같은 파라미터로 실험을 하였는데, 좋은 성능을 보였지만 학습 시간이 resnet18보다 꽤 많이 걸렸다.

이 당시에는 EarlyStopping을 구현하지 않았었어서 하이퍼파라미터를 튜닝하는 것이 많이 번거로웠다.

EarlyStopping 이전에 성능 확인

# transform 을 주는 것이 좋을까?

통제 변인
- model = k-fold resnet50
- loss fn = focal loss
- optimizer = adam
조작 변인

종속 변인
- f1 score (auto)
- accuracy

실험 결과

no_tr = RandomPerspective, GaussianBlur 수행하지 않았을 때 && tr_random_blur =  RandomPerspective, GaussianBlur 수행했을 때

실험 결과 transform을 진행한 것이 layer가 많은 무거운 모델에 효과적이라는 것을 알 수 있었다.
EarlyStopping + Resnet50 실험을 진행하였을 때, 위와 같이 한 번 accuracy가 떨어진 뒤에 크게 상승하는 것을 많이 보았다. 이는 모델이 잠시 local minimum에 빠진 것이라고 볼 수 있다.
~~(마음이 급해서 이를 제대로 확인하지 않은 것이 후회된다..)~~

## 이미지 분류 대회를 마무리 하면서 느낀 점

Task를 수행하기 전에 깃허브나 논문을 많이 찾아보지 않을 것을 후회한다. 다음에는 시작하기 전에 어떤 모델들이나 방법, 도구, 최적의 하이퍼파라미터 등을 찾아보고 정리해둔 후에 시작해야 겠다.
왜 수행하는지, 이를 한다면 다음에 수행할 것은 무엇인지 등을 정리하고, 이를 기반으로 소통해야 겠다. (대회 막바지에 다다를 때, 왜 이 활동을 하는지, 어떤 작업을 해야하는지 확신이 없어서 힘들었다.)
토론 게시판을 확인해보면서 내 코드를 개선시켜 나가야 겠다. (대회가 끝나고, 토론 게시판의 글들을 확인해보니 Gradient Cam 이라는 model이 어느 부분을 focus하는지 시각화해주는 도구가 있다는 것을 확인하였다. 직접 적용해봐야겠다.)
베이스라인 코드를 그대로 사용하고, 그 구조에 익숙해지도록 해야겠다.