[Week 6- Day 4] 회고

2022. 2. 25. 00:55About Me/AI Tech

# train & eval 차이, resnet.fc 필요

train하고 eval하는 코드는 다르다. train에서는 model(X)라면, eval에서는 model(X).argmax(dim=-1)을 해줘야 한다. 그래야 batch_size만큼의 list로 돌아옴. -> 이건 더 조사 필요

resnet을 통과 후에 18개의 클래스로 분류해야 하기 때문에 resnet.fc 에 Linear() 설정이 필요함.

원래 다양한 loss함수를 시도했는데, 원하는 포맷이 다른 함수도 있었다. Acc를 직접 구현하니 .backward()에서 미분 허용해야 한다는 ㅇ류가 떠서, required_grad=True 로 하는 방법을 찾아봄. 나중에 피어세션에서 이를 Variable()에 넣어주면 float()형 변환이나 미분 허용하는 것을 자동으로 해준다고 함.

 

 

## 피어 세션

미션 : 피어 세션 하루종일 상주, 오피스 아워- 베이스라인 코드 설명

 

흑흑 오늘 리더보드에 제출을 했는데 Acc가 3점인가 나와서 엄청 부끄러웠다. 근데 중요한 건 그러고 앞서 성능이 잘나온 모델들의 파라미터를 참고하여 돌려보았는데 더 성능이 나쁘게 평가되었다는 것이다. 여기 쥐구멍 어디있지..ㅋㅋ

처음에는 AlexNet으로 돌려보려고 했는데 ResNet이 파라미터 수도 적고 성능도 좋다는 것을 깨달았다. 생각보다 overfitting도 잘 되고..

모르겠다. 급한 마음에 여러 개를 그냥 제출했는데 점수가 점점 낮아져서 좀 그랬다. ㅇㅅ

아니 나는 더 Acc가 잘나오길래 더 좋아졌나보다 했는데, 이게 노이즈가 많은 데이터라 그런지 규제 같은 게 필요하겠다는 생각이 든다.

내일은.. 효과적인 transform이나 augmentation 을 찾아가야 겠다.

갈 길이 멀구만.... 

 

 

 

 

 

 

 

 

 

 

 

Hola

반응형

'About Me > AI Tech' 카테고리의 다른 글

[Week 7- Day 1] 회고  (0) 2022.03.01
[Week 6- Day 5] 회고  (0) 2022.02.26
[Week 6- Day 3] 회고  (0) 2022.02.24
[Week 6- Day 2] 회고  (0) 2022.02.23
[Week 6- Day 1] 회고  (0) 2022.02.21