개발공부

8/10(화) 머신러닝 스터디, 회장단일

kdb1248 2021. 8. 10. 22:15

오늘은 제대로 머신러닝 스터디를 하게 된 처음. 

그래도 유용한 부분들이라고 생각되는 부분들을 코드를 통해 알려줄 수 있어서 좋았다. 독립변수 두개를 곱해서 그걸 새로운 독립변수로 만드는 것. age*class가 서로간에 상관이 있어서 그런변수를 만들었다는 피드백이 좋았다.

nan값 처리할때, 그냥 미디언이 아니라, 데이터 조건별로 미디언 내서 nan값 채워넣기 하는 과정 좋았고

 

2 장

seaborn 히트맵이 상관관계 나타내는 용도라는 거

페어플랏 서로다른 변수들간의 분포와 상관관계 보여주기

 

이상치로부터 추가적인 정보 보기도 하고 iqr1분위 부터 3분위까지를 정상적인 거라고 보고, z-score이용해서 z값 너무 큰것들 보기도 하고

이차원이상 카드에서 거래가 엄청 많다 하면 사기다.(마할라 노비스의 거리)

 

 

한피처에서 결측값 너무 많으면 피처 제거하기도, 평균값 대체하면 분산적어져서 안정적인 데이터 될수도

보간법 시계열 데이터

원핫 인코딩 차원이 엄청 늘어날 가능성 있따.

비지도에선 fit 통해 학습이 아니라 구조 파악 정답이 없으니까 맞추는게 불가능 하기 떄문에

 

테스트 데이터 우리 손에 없다 보면 돼, 테스트로 검증을 하게 되면 그거 따라서 모델 변해서 과적합 될 수 있어

 

svm 은 데이터 사이에 경계선 찾는 거임 하이퍼 파라미터 바꿀때마다 경계선 어떻게 바뀌는지

 

재현율 현실의 포지티브를 얼마나 잘 재현, 정밀도 내가 예측 하는 기계가 얼마나 잘 예측

머지 위해서 리셋 인덱스

오차가 심한 친구들의 중요도 높여서 걔네 부터 제대로 분류하는 거에 중점. 

엔트로피 보기

 

2. 선배님께 카톡 한거

3. 사봉단 보고서 제출 리마인드

4. 설명회 영상 리마인드

5. 회장 인사말 내가 생각못한 부분들 고치기

6. 카뉴 내가 일부 파트 맡아서 해야한다는 거

7. np 관련 계획 세우기

8. 멘토링 선배 섭외 현제형

 

오늘 느낀 지점은 내가 분위기 풀어주는거에 괜찮은 부분들이 있는거 같기도, 스터디 때도, 선배 섭외할떄도

그리고 인코에서 느꼈던 리마인드 방식들 쓴거 잘했다.

나름 열심히 공부하는 거 같아서 좋은듯! 내일은 회장단에 투입하기!