'STUDYING/머신러닝&딥러닝' 카테고리의 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2025/02 »
일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28

Tags more

Archives

Today

Total

관리 메뉴

목록STUDYING/머신러닝&딥러닝 (16)

좌충우돌 개발자의 길

[WEEK6] 혼자서 공부하는 머신러닝 + 딥러닝 6주차

🎉기본미션 - Ch.07-1 문제풀고 인증샷🎉 🎉추가미션 - Ch.07-2 문제풀고 인증샷🎉

STUDYING/머신러닝&딥러닝 2021. 8. 16. 23:23

[WEEK5] 혼자서 공부하는 머신러닝 + 딥러닝 5주차

🎉기본미션 - k-평균 알고리즘 작동 방식 설명하기🎉 1. 무작위로 k개의 클러스터 중심을 정하기 2. 각 샘플에서 가장 가까운 클러스터 중심을 찾아 해당 클러스터의 샘플로 지정하기 3. 클러스터에 속한 샘플의 평균값으로 클러스터 중심을 변경하기 4. 클러스터 중심에 변화가 없을 때까지 2번으로 돌아가 반복하기 🎉기본미션 - Ch.06-3 문제풀고 인증샷🎉 Q1. 특성이 20개인 대량의 데이터셋이 있습니다. 이 데이터셋에서 찾을 수 있는 주성분 개수는 몇개일까요? A1. 2번 20개 Q2. 샘플 개수가 1000개이고 특성 개수는 100개인 데이터셋이 있습니다. 즉, 이 데이터셋의 크기는 (1000,100) 입니다. 이 데이터를 사이킷런의 PCA 클래스를 사용해 10개의 주성분을 찾아 변환했습니다. 변환된..

STUDYING/머신러닝&딥러닝 2021. 8. 8. 22:26

[WEEK4] 혼자서 공부하는 머신러닝 4주차

🎉기본미션 - 교차 검증을 그림으로 설명하기🎉 🎉선택미션 - Ch.5-3 앙상블 모델 손코딩 코랩 화면 인증샷🎉

STUDYING/머신러닝&딥러닝 2021. 8. 1. 22:48

[WEEK3] 혼자서 공부하는 머신러닝 + 딥러닝 3주차

🎉스터디 내용 정리 목록🎉 https://ksumin-dev.tistory.com/68?category=1031634 9강 : 로지스틱 회귀 알아보기 데이터 준비하기 unique 함수 사용하기 Species 열에서 고유한 값을 추출해보기 - unique 함수 사용 to_numpy() 데이터 프레임에서 여러 열을 선택하면 새로운 데이터프레임이 반환되는데 이를 to_numpy매 ksumin-dev.tistory.com https://ksumin-dev.tistory.com/69?category=1031634 10강 : 확률적 경사 하강법 점진적 학습 이전에 훈련한 모델을 버리지 않고 새로운 데이터에 대해서만 조금씩 더 훈련하기 확률적 경사 하강법 점진적 학습의 알고리즘 경사를 따라 내려가는 방법이라는 뜻으로..

STUDYING/머신러닝&딥러닝 2021. 7. 24. 21:36

10강 : 확률적 경사 하강법

점진적 학습 이전에 훈련한 모델을 버리지 않고 새로운 데이터에 대해서만 조금씩 더 훈련하기 확률적 경사 하강법 점진적 학습의 알고리즘 경사를 따라 내려가는 방법이라는 뜻으로 훈련세트에서 랜덤하게 하나의 샘플을 골라 가장 가파른 길을 찾아 내려오는 것을 확률적 경사 하강법이라고 한다. IF) 다 내려오지 않았는데 모든 샘플을 다 썼다면? 다시 처음부터 시작하면 된다 훈련 세트에 모든 샘플을 다시 채워 넣고 다시 랜덤하게 하나의 샘플을 선택해 이어서 경사를 내려감 ⇒ 에포크 : 확률적 경사 하강법에서 훈련 세트를 한 번 모두 사용하는 과정을 말함 에포크 확률적 경사 하강법에서 훈련 세트를 한 번 모두 사용하는 과정을 말함 일반적으로 경사 하강법은 수십, 수백 번 이상 에포크를 수행함 미니배치 경사 하강법 한..

STUDYING/머신러닝&딥러닝 2021. 7. 24. 21:17

9강 : 로지스틱 회귀 알아보기

데이터 준비하기 unique 함수 사용하기 Species 열에서 고유한 값을 추출해보기 - unique 함수 사용 to_numpy() 데이터 프레임에서 여러 열을 선택하면 새로운 데이터프레임이 반환되는데 이를 to_numpy매서드로 넘파이 배열로 바꾸어 fish_input에 저장 (+ fish_target에 저장) 5개 행을 출력해봄 훈련세트와 테스트세트로 나누기 사이킷런의 StandardScaler 클래스를 사용해 훈련 세트와 테스트 세트를 표준화 전처리하기 훈련세트의 통계값으로 테스트 세트 변환하기 k-최근접 이웃 분류기의 확률 예측 다중 분류 : 타깃 데이터에 2개 이상의 클래스가 포함된 문제 이진분류와 모델을 만들고 훈련한느 방식은 동일함 사이킷런에선느 편리하게 문자열로 된 타깃값을 그대로 사용 ..

STUDYING/머신러닝&딥러닝 2021. 7. 24. 21:04

[WEEK2] 혼자서 공부하는 머신러닝 + 딥러닝 2주차

🎉스터디 내용 정리 목록🎉 https://ksumin-dev.tistory.com/61 6강 : k-최근접 이웃 회귀 농어의 무게를 예측하라 회귀 : 임의의 숫자를 예측하는 것 (타깃==임의의 숫자 == 농어의 무게) 지도학습에 회귀와 분류가 있는 것 → 분류 : 주변 이웃의 클래스를 보고 네모이다! → 회귀 : 주변 ksumin-dev.tistory.com https://ksumin-dev.tistory.com/64 7강 : 선형회귀 최근접 이웃의 문제점 : 50cm-1kg 농어를 1.5kg 이 아닌 1kg으로 판단한다?? → 위 그래프 : 다이아몬드가 이웃인데 아래 그래프인 이웃으로만 나타낸 그래프를 보면 길이가 차이가 나도 이웃들로 판 ksumin-dev.tistory.com https://ksum..

STUDYING/머신러닝&딥러닝 2021. 7. 19. 00:00

8강 : 특성 공학과 규제

다중 회귀 여러개의 특성을 사용함 (↔ 다항 회귀) 특성 공학 새로운 특성을 추가하거나 특성을 발견하거나 특성끼리 조합을 하는 것 머신러닝 알고리즘은 특성공학의 영향을 많이 받음 판다스 데이터로 준비 데이터 프레임으로 되어 있는데 이는 다른 종류의 데이터 타입을 받을 수 있는 특징이 있다. 엑셀과 비슷하다 판다스로 원격에 있는 파일을 불러와서 넘파이 배열로 만들기 csv 파일 한줄에 샘플 하나가 들어있음 (length, height, wiedth) 콤마로 나눠진 열마다 특성 데이터가 들어있음 read_csv() : 파일 불러오기 to_numpy() : 넘파이 배열로 만들기 다항 특성 만들기 form sklearn.preprocessing import PolynomialFeatures # degree = ..

STUDYING/머신러닝&딥러닝 2021. 7. 18. 22:57

7강 : 선형회귀

최근접 이웃의 문제점 : 50cm-1kg 농어를 1.5kg 이 아닌 1kg으로 판단한다?? → 위 그래프 : 다이아몬드가 이웃인데 아래 그래프인 이웃으로만 나타낸 그래프를 보면 길이가 차이가 나도 이웃들로 판단하기 때문에 정확한 값이 예측되지 않음 선형회귀 위의 문제를 해결할 수 있는 방법 → 세번째 직선이 가장 좋은 직선 선형회귀 - 사이킷런에서 사용법 → y = ax +b 꼴의 직선 방정식으로 이루어짐 → from sklearn.linear_model import LinerRegression을 이용해 불러옴 → ls.coef_ 처럼 _ 를 사용하는 이유 : 사이킷런에서는 학습한 어떤 데이터들을 저장시, 다른 속성과 구분하기 위해 사용 ⇒ 아 이 모델은 내가 작성한 것이 아닌 어떤 학습을 해서 나온 데..

STUDYING/머신러닝&딥러닝 2021. 7. 18. 22:48

6강 : k-최근접 이웃 회귀

농어의 무게를 예측하라 회귀 : 임의의 숫자를 예측하는 것 (타깃==임의의 숫자 == 농어의 무게) 지도학습에 회귀와 분류가 있는 것 → 분류 : 주변 이웃의 클래스를 보고 네모이다! → 회귀 : 주변 이웃의 타깃을 보고 평균 내서 구하기! 농어의 길이만 사용 → perch_weight가 타깃값 → 분류일 때는 클래스(별, 네모, 마름모..)로 구별이 가능하기에 특성을 두개로 해도 괜찮 → 회귀일 때는 분류처럼 구별하기 힘들어서(임의의 숫자로 구분하기에) 특성 1개, 타깃1개로 구분 (특성 : 길이, 타깃: 무게) 훈련 세트 준비하기 stratify가 없는 이유 : stratify 매개변수(지정안하면 false라서 지정해줘야함)에 타깃값을 넣었는데 이유는 클래스별로 골고루 훈련세트랑 테스트 세트랑 나누라..

STUDYING/머신러닝&딥러닝 2021. 7. 14. 22:37

이전 Prev 1 2 Next 다음

목록STUDYING/머신러닝&딥러닝 (16)

좌충우돌 개발자의 길

티스토리툴바