About Me/AI Tech(95)
-
[Week 14- Day 3] 회고
# Genetic Algorithm Evolved Virtual Creatures- by Karl Sims, 1994 논문 참고 다양한 GA 유형이 존재하는데, 강화학습을 잘 알면 유리 (ex. ES) # Style Transfer [CV] 한 도메인에 있는 이미지 스타일을, 다른 도메인에 있는 이미지로 바꾸는 Task. Text data를 다루는 경우, [NLP] Text Style Transfer 라는 Task가 있다. ## 피드백 태깅의 노예가 되어 하루 왠종일 sentence에 맞는 태그를 붙여 주었다. 가이드라인을 상세하게 예시와 함께 잘 작성하고, 용이한 범위까지 잘 고려해야 겠다고 느꼈다. 다음 주 논문 발표라 관심이 가는 Task를 찾아보다가, 저번에 마스터 님이 얘기해 주신 Style을 ..
2022.04.21 -
[Week 14- Day 2] 회고
# 오피스 아워 RE task는 잘 정의된 task에 속하는데, 기존의 논의가 없는 경우도 있음. "무언가 하고 싶다"는 니즈나 동기로 데이터 구축을 시작하는데, 다음과 같은 질문 과정을 거침. (Task화) 어떤 Task 및 목적에 해당하는지 (core-question) 질문/ 명령 표현을 어떻게 인식할 지 그러한 data가 존재하는지? 없으면 어떻게 만들지? 데이터 구축은 "제품 생산"의 과정이라고 생각하면 됨. 일단, 원시 코퍼스를 선택 후 연구 진행 및 전체 프로세스를 구상함. 여기서 역할 배분도 이뤄짐. 서로 의견 맞추고 제품 구상하는 파일럿 과정을 거침. (Task, I/O, 구축 가이드라인 등) 부분적으로 생산해보고, quality check하면서 위 과정을 대게 7~8번 진행하기도 함. 등..
2022.04.20 -
[Week 14- Day 1] 회고
# Annotation Tool Annotation Tool에 대해 좀 더 찾아보았는데, 이미지/ 시계열 등 다양한 태깅 툴을 찾아볼 수 있었다. 찾아보면서 느낀 것은 Tagtog가 정말 직관적으로 웹에서도 편리하게 사용할 수 있도록 하는 잘 만들어진 Tool이었다는 것이다. Annotation Tool 정리 Labeling Tools Link-1 Link-2 Image CVAT- 컴퓨터 비전을위한 온라인 대화 형 비디오 및 이미지 ... blog.naver.com 13 Best Image Annotation Tools of 2021 [Reviewed] What is the best image annotation tool? Check out the list of the 13 most popular ima..
2022.04.19 -
[Week 13- Day 5] 회고
# 가이드라인 작성 추가로 계속 데이터 라벨링하면서, QA에 필요한 부분 정리하여 제출 했다. 이제 주말동안 계속 라벨링 해야 할 것 같다. 아침부터 Tagtog에 계속 파일이 안올라가서 local에서만 작업했다. (다른 annotation tool이 없을까?) # 캐글 스터디- KLUE 대회 솔루션 정리 - CV 트랙의 경우, nn dection이 대표적인 라이브러리 - entity embedding을 넣어주면, 추가로 weight를 넣어주니 행렬 분해가 일어나서 성능 향상 - 추천 트랙의 경우, user table과 item table을 이렇게 2개의 상호작용을 학습하면서 유사도가 높은 것을 추천 AutoEncoder기반 Transformer기반에 따라 모델의 학습 양상이 완전히 다름 - robust..
2022.04.16 -
[Week 13- Day 4] 회고
# Entity와 Relation 정의 데이터 양이 워낙 많다 보니까, 여러 사람들과의 작업이 필요한데 모든 작업자를 최대한 고려하여 가이드라인을 작성하는 것이 상당히 어렵게 느껴졌다. 일일이 파일 뜯어보면서 ner로 어떤 걸 entity로 삼으면 좋을지 고민하고, 가지고 있는 데이터셋에는 어떤 relation 들이 있는지 분석하는 시간을 갖었다. ## 피드백 확실히 솔직함이 내게 자신감을 가져다 주는 것 같다. 내가 맡은 데이터셋에는 이런이런 관계들이 있더라. 난 이렇게 생각하고 태깅했는데 어떻게 생각하냐. 등등 원래 낮잠을 진짜 안자는 성격인데, 이번 년도 봄은 왜 이렇게 졸린 지 모르겠다. 나도 이제 달마다 생각정리도 할겸, 회고를 작성해야 겠다. 자잘자잘한 할 일들은 그 때를 위해 남겨두자. 부푼..
2022.04.15 -
[Week 13- Day 3] 회고
# Wiki-extractor https://github.com/boychaboy/wiki_extractor EDA - 최소 문장길이 = 17 - 최대 문장길이 = 560 - 최소 문장 수 = 3 - 최대 문장 수 = 453 (?) # 두런두런- How to 성장하면 좋을까 IC1 Machine Learning Engineer - Dropbox Engineering Career Framework IC1 Machine Learning Engineer I deliver lots of high quality production-ready code with direction from the team ScopeArea of ownership and level of autonomy / ambiguityCollabo..
2022.04.14