일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- styledcomonents
- 코딩테스트
- 혼공단
- 알고리즘
- 백준 #코딩테스트
- clipboardapi
- Redux
- axios
- useEffect
- 혼공챌린지
- typeScript
- 백준 #코딩테스트 #코테 #알고리즘
- 혼자공부하는머신러닝
- 구조분해할당
- CSS
- error맛집
- 혼자공부하는머신러닝딥러닝
- js
- 백준
- REACT
- 타입스크립트
- 딥러닝
- 혼공머신
- reactmemo
- 에러해결방안
- 머신러닝
- 초기값 설정하기
- 리액트
- 유니티 #게임개발
- TS
- Today
- Total
목록STUDYING/머신러닝&딥러닝 (16)
좌충우돌 개발자의 길
🎉기본미션 - Ch.07-1 문제풀고 인증샷🎉 🎉추가미션 - Ch.07-2 문제풀고 인증샷🎉
🎉기본미션 - k-평균 알고리즘 작동 방식 설명하기🎉 1. 무작위로 k개의 클러스터 중심을 정하기 2. 각 샘플에서 가장 가까운 클러스터 중심을 찾아 해당 클러스터의 샘플로 지정하기 3. 클러스터에 속한 샘플의 평균값으로 클러스터 중심을 변경하기 4. 클러스터 중심에 변화가 없을 때까지 2번으로 돌아가 반복하기 🎉기본미션 - Ch.06-3 문제풀고 인증샷🎉 Q1. 특성이 20개인 대량의 데이터셋이 있습니다. 이 데이터셋에서 찾을 수 있는 주성분 개수는 몇개일까요? A1. 2번 20개 Q2. 샘플 개수가 1000개이고 특성 개수는 100개인 데이터셋이 있습니다. 즉, 이 데이터셋의 크기는 (1000,100) 입니다. 이 데이터를 사이킷런의 PCA 클래스를 사용해 10개의 주성분을 찾아 변환했습니다. 변환된..
🎉기본미션 - 교차 검증을 그림으로 설명하기🎉 🎉선택미션 - Ch.5-3 앙상블 모델 손코딩 코랩 화면 인증샷🎉
🎉스터디 내용 정리 목록🎉 https://ksumin-dev.tistory.com/68?category=1031634 9강 : 로지스틱 회귀 알아보기 데이터 준비하기 unique 함수 사용하기 Species 열에서 고유한 값을 추출해보기 - unique 함수 사용 to_numpy() 데이터 프레임에서 여러 열을 선택하면 새로운 데이터프레임이 반환되는데 이를 to_numpy매 ksumin-dev.tistory.com https://ksumin-dev.tistory.com/69?category=1031634 10강 : 확률적 경사 하강법 점진적 학습 이전에 훈련한 모델을 버리지 않고 새로운 데이터에 대해서만 조금씩 더 훈련하기 확률적 경사 하강법 점진적 학습의 알고리즘 경사를 따라 내려가는 방법이라는 뜻으로..
점진적 학습 이전에 훈련한 모델을 버리지 않고 새로운 데이터에 대해서만 조금씩 더 훈련하기 확률적 경사 하강법 점진적 학습의 알고리즘 경사를 따라 내려가는 방법이라는 뜻으로 훈련세트에서 랜덤하게 하나의 샘플을 골라 가장 가파른 길을 찾아 내려오는 것을 확률적 경사 하강법이라고 한다. IF) 다 내려오지 않았는데 모든 샘플을 다 썼다면? 다시 처음부터 시작하면 된다 훈련 세트에 모든 샘플을 다시 채워 넣고 다시 랜덤하게 하나의 샘플을 선택해 이어서 경사를 내려감 ⇒ 에포크 : 확률적 경사 하강법에서 훈련 세트를 한 번 모두 사용하는 과정을 말함 에포크 확률적 경사 하강법에서 훈련 세트를 한 번 모두 사용하는 과정을 말함 일반적으로 경사 하강법은 수십, 수백 번 이상 에포크를 수행함 미니배치 경사 하강법 한..
데이터 준비하기 unique 함수 사용하기 Species 열에서 고유한 값을 추출해보기 - unique 함수 사용 to_numpy() 데이터 프레임에서 여러 열을 선택하면 새로운 데이터프레임이 반환되는데 이를 to_numpy매서드로 넘파이 배열로 바꾸어 fish_input에 저장 (+ fish_target에 저장) 5개 행을 출력해봄 훈련세트와 테스트세트로 나누기 사이킷런의 StandardScaler 클래스를 사용해 훈련 세트와 테스트 세트를 표준화 전처리하기 훈련세트의 통계값으로 테스트 세트 변환하기 k-최근접 이웃 분류기의 확률 예측 다중 분류 : 타깃 데이터에 2개 이상의 클래스가 포함된 문제 이진분류와 모델을 만들고 훈련한느 방식은 동일함 사이킷런에선느 편리하게 문자열로 된 타깃값을 그대로 사용 ..
🎉스터디 내용 정리 목록🎉 https://ksumin-dev.tistory.com/61 6강 : k-최근접 이웃 회귀 농어의 무게를 예측하라 회귀 : 임의의 숫자를 예측하는 것 (타깃==임의의 숫자 == 농어의 무게) 지도학습에 회귀와 분류가 있는 것 → 분류 : 주변 이웃의 클래스를 보고 네모이다! → 회귀 : 주변 ksumin-dev.tistory.com https://ksumin-dev.tistory.com/64 7강 : 선형회귀 최근접 이웃의 문제점 : 50cm-1kg 농어를 1.5kg 이 아닌 1kg으로 판단한다?? → 위 그래프 : 다이아몬드가 이웃인데 아래 그래프인 이웃으로만 나타낸 그래프를 보면 길이가 차이가 나도 이웃들로 판 ksumin-dev.tistory.com https://ksum..
다중 회귀 여러개의 특성을 사용함 (↔ 다항 회귀) 특성 공학 새로운 특성을 추가하거나 특성을 발견하거나 특성끼리 조합을 하는 것 머신러닝 알고리즘은 특성공학의 영향을 많이 받음 판다스 데이터로 준비 데이터 프레임으로 되어 있는데 이는 다른 종류의 데이터 타입을 받을 수 있는 특징이 있다. 엑셀과 비슷하다 판다스로 원격에 있는 파일을 불러와서 넘파이 배열로 만들기 csv 파일 한줄에 샘플 하나가 들어있음 (length, height, wiedth) 콤마로 나눠진 열마다 특성 데이터가 들어있음 read_csv() : 파일 불러오기 to_numpy() : 넘파이 배열로 만들기 다항 특성 만들기 form sklearn.preprocessing import PolynomialFeatures # degree = ..
최근접 이웃의 문제점 : 50cm-1kg 농어를 1.5kg 이 아닌 1kg으로 판단한다?? → 위 그래프 : 다이아몬드가 이웃인데 아래 그래프인 이웃으로만 나타낸 그래프를 보면 길이가 차이가 나도 이웃들로 판단하기 때문에 정확한 값이 예측되지 않음 선형회귀 위의 문제를 해결할 수 있는 방법 → 세번째 직선이 가장 좋은 직선 선형회귀 - 사이킷런에서 사용법 → y = ax +b 꼴의 직선 방정식으로 이루어짐 → from sklearn.linear_model import LinerRegression을 이용해 불러옴 → ls.coef_ 처럼 _ 를 사용하는 이유 : 사이킷런에서는 학습한 어떤 데이터들을 저장시, 다른 속성과 구분하기 위해 사용 ⇒ 아 이 모델은 내가 작성한 것이 아닌 어떤 학습을 해서 나온 데..
농어의 무게를 예측하라 회귀 : 임의의 숫자를 예측하는 것 (타깃==임의의 숫자 == 농어의 무게) 지도학습에 회귀와 분류가 있는 것 → 분류 : 주변 이웃의 클래스를 보고 네모이다! → 회귀 : 주변 이웃의 타깃을 보고 평균 내서 구하기! 농어의 길이만 사용 → perch_weight가 타깃값 → 분류일 때는 클래스(별, 네모, 마름모..)로 구별이 가능하기에 특성을 두개로 해도 괜찮 → 회귀일 때는 분류처럼 구별하기 힘들어서(임의의 숫자로 구분하기에) 특성 1개, 타깃1개로 구분 (특성 : 길이, 타깃: 무게) 훈련 세트 준비하기 stratify가 없는 이유 : stratify 매개변수(지정안하면 false라서 지정해줘야함)에 타깃값을 넣었는데 이유는 클래스별로 골고루 훈련세트랑 테스트 세트랑 나누라..