About Me(99)
-
[Week 17- Day 3] 회고
# ERROR Tracking [상황] : 주어진 경로의 파일을 통해 모델 train하려는데 오류 발생 [에러 메시지] : UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 0: invalid start byte [해결 방안] : [Solved] UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 0: invalid start byte - Exception Error To Solve UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 0: invalid start byte Error Firs..
2022.05.12 -
[Week 17- Day 1] 회고
# haystack- RAG Papers with Code - RAG Explained Retriever-Augmented Generation, or RAG, is a type of language generation model that combines pre-trained parametric and non-parametric memory for language generation. Specifically, the parametric memory is a pre-trained seq2seq model and the non-parametric paperswithcode.com Haystack Docs Haystack enables Question Answering at Scale haystack.deeps..
2022.05.10 -
[Week 16- Day 5] 회고- 깃허브 특강
# 깃허브 특강 # Git Flow 우린 Git-flow를 사용하고 있어요 | 우아한형제들 기술블로그 {{item.name}} 안녕하세요. 우아한형제들 배민프론트개발팀에서 안드로이드 앱 개발을 하고 있는 나동호입니다. 오늘은 저희 안드로이드 파트에서 사용하고 있는 Git 브랜치 전략을 소개하려고 합 techblog.woowahan.com ## 피드백 캐글 스터디로 저녁에 잠시 만났는데, 디스커션 확인하면서 빨리 작업을 시작해야할 것 같다. 다음 주 수요일에 한 번더 만나기로 했다.
2022.05.06 -
[Week 16- Day 2] 회고
# 네이버- Search 콜로키움 검색 엔진에 대한 자세한 얘기를 들어볼 수 있어서 좋았다. # Overleaf로 이력서 작성 사용 가능한 한국어 폰트 Which OTF or TTF fonts are supported via fontspec? - Overleaf, Online LaTeX Editor An online LaTeX editor that’s easy to use. No installation, real-time collaboration, version control, hundreds of LaTeX templates, and more. www.overleaf.com Overleaf에서 한국어 사용하는 방법 Korean - Overleaf, 온라인 LaTex 편집기 사용하기 쉬운 온라인 LaTe..
2022.05.04 -
[Week 16- Day 1] 회고
# Dense Retriever ## DPR for ODQA (EMNLP, 2020) Papers with Code - Dense Passage Retrieval for Open-Domain Question Answering 12 code implementations in PyTorch and TensorFlow. Open-domain question answering relies on efficient passage retrieval to select candidate contexts, where traditional sparse vector space models, such as TF-IDF or BM25, are the de facto method. In this wor paperswithcode...
2022.05.02 -
[Week 15- Day 5] 회고
# Style Transfer 논문 발표 # MRC 베이스라인 코드 설명 query와 content가 함께 입력이 되는 데, 정해진 max_seq_len을 초과할 경우 answer를 찾을 수 없는 문제가 발생하기도 한다. 이를 위해 tokenizer에 return_overflowing_tokens=True로 지정하여 처리할 수 있다. max_seq_len을 초과할 경우, (query+뒷부분이 잘린 content) sentence랑 (query+잘린 문장 부분부터의 content) sentence 이런 식으로 여러 개의 문장으로 처리한다. 이 때 각각 원래 answer에 매칭해주어야 하는데 이를 수행해주는 역할을 한다. GitHub - huggingface/transformers: 🤗 Transformer..
2022.04.29