About Me(99)
-
< 혼자 공부하는 머신러닝+딥러닝 > 박해선
PCA 한계, 주성분 추출 프로세스 알고리즘 순서? 왜 사용? 문제 캔 와인을 판매하려는데, 와인 표시가 누락되었다. 알코올 도수, ph값, 당도로 와인 종류(레드와인, 화이트와인)를 구별해보자. # 1. 로지스틱 회귀 이진 분류 문제이므로 수행 결과 값이 다량의 실수 파라미터라, 설명하기 어렵다. 특성 표준화 훈련/테스트 점수 확인 → 다항특성 고려 # 2. 결정 트리 이유를 설명하기 쉬우므로 수행 (데이터 표준화 필요X) 노드의 데이터 분할 기준= 불순도 잎노드에서 가장 많은 클래스로 예측 트리 그래프 시각화로 직관적으로 분류 확인 가지치기 (트리의 최대깊이 지정) 불순도 지니 불순도순수 노드 : 하나의 class만 있는 노드 (지니 불순도=0) 부모 노드와 자식 노드의 불순도 차이(정보 이득)가 크..
2022.02.17 -
[Week 5- Day 3] 회고
# Plotly 인터랙티브한 시각화를 위한 라이브러리 배포나 자체로 디자인도 화려해서 다른 라이브러리들보다 경쟁력있음 # RUN 과 CMD, ENTRYPOINT 명령어의 차이? - docker run 은 명령어를 새로운 Container에서 실행한다. 주로 특정 이미지 위에서 writeable Container을 생성하고, 특정 명령을 사용하여 주어진 명령어를 수행한다. CMD와 ENTRYPOINT는 shell 명령어는 아니고, Dockerfile 내에서 사용하는 명령어다. 두 명령어 모두 Container가 실행할 때 어떤 명령어가 수행되야 하는지를 나타낸다. - ENTRYPOINT는 그 Container가 실행가능하도록 하기 위해 정의해야 한다. - CMD는 ENTRYPOINT 명령 또는 Contai..
2022.02.16 -
[Week 5- Day 2] 회고
# 가상화 란? 개발 시에 Servic 운영 환경(Server)에 직접 들어가 개발하지 않고, local 환경에서 개발 후에 배포를 함. 그래서 branch 전략(main, develop, staging, feature 등)이 존재하는 것임. 예를 들어 local 환경이 MacOS 이고, production 환경이 Linux 이라고 하자. OS가 달라서, 라이브러리나 python 등 설치를 다르게 진행해야 한다. 이 때, 환경 변수나 usergroup, permission 등도 확인이 필요함. 이렇게 여러가지 변수를 고려하지 않으면 실행이 되지 않음. 따라서 README 등에 다양한 설정을 기록해두고, 항상 실행하도록 함. 이러한 작업들이 반복되니 귀찮으니, 셸 스크립트를 만들어둠. 근데 만약 운영하는 ..
2022.02.15 -
[Week 5- Day 1] 회고
# Product Serving = MLOps 개론 (ex. Prototype, Linux, CI/ CD, MLflow, AirFlow 등) !! Why 만들어졌는지 집중 (-> 1년 후엔 거의 안쓰는 lib가 될 수 O) Q. 더 필요한 부분은? 더 개선하려면? 왜 이렇게 구현? (=> 제약조건, 상황에 따른 최선의 선택을 추구) 바라는 모습? - 큰 그림 인지, 능동적인 자세(직접 문제정의& 필요한 도구 탐색), 지속적으로 개선, ML프로세스 이해 ex. 어떤 방법적용? 왜 해야? 어떤 방법이 좋나? 왜 좋나? # ML 프로세스 (⭐️문제정의 중요) 현상 파악 (Q. 어떤 일이 발생? 어려움? 해결하고 싶은 거? 추가로? 가설? 데이터?) 목적/ 문제 정의 (Q. 무얼 해결하고 싶나? 알고 싶나?)(..
2022.02.14 -
< 함께 자라기 : 애자일로 가는 길 > 김창준
성장 deliberate practice (동기) 1만 시간은 경험X, 연습X, 더 나아지기 위해 or 단점을 없애기 위해 노력한 시간을 말한다. 피드백을 짧은 주기로 얻자 (→ 실수 교정 및 행동조정을 위해서) 회고 필자는 동료와 함께 한 해를 되돌아본다고 한다. 어떤 걸 느꼈는지 어떤 교훈을 배웠는지 나에게 무엇을 투자 → 1, 2년 후를 결정 자기계발(지식/ 능력) → 복리로 돌아온다 Q. 어떤 일을 하였을 때, 성과를 낼 수 있었나요? A : 하기로 한 일 B : A를 개선한 일 C : B를 개선한 일 (⭐️ 성과! up up 수용하고 올라가 —> 부트스트래핑) Q. To servive? → 학습하기 힘든 환경에서, 학습하기 힘든 주제를 골라야 한다 goal(모호), 선택할 행동(불확실), goa..
2022.02.14 -
[Week 4- Day 5] 회고
# Radar Chart (Star Plot) = 중심점 기준으로 n개의 변수값을 표현. 극좌표계 사용. 데이터의 quality 표현에 Good. (ex. 캐릭터 스펙, 운동선수 비교) 주의점! - 각 feature 독립적 & 척도가 같아야함. - 면적은 중요X (feature 순서에 따라 많이 달라짐) - feature가 많아질수록, 가독성 떨어짐. # [피어세션 발표] AutoEncoder https://hyunbool.notion.site/AutoEncoder-ed668277c9a043e79ff09639f8136f2e ## 피어 세션 스페셜 피어세션 때, 양궁이 취미인 분을 만났다. 들어보니 양궁카페도 있다고 한다. 신촌에서 있어서 보니까 사격장 비슷한 느낌으로 있었다. 요새 빠져있는 거나 심취한 ..
2022.02.11