좌충우돌 개발자의 길

[WEEK5] 혼자서 공부하는 머신러닝 + 딥러닝 5주차 본문

STUDYING/머신러닝&딥러닝

[WEEK5] 혼자서 공부하는 머신러닝 + 딥러닝 5주차

sustronaut 2021. 8. 8. 22:26

🎉기본미션 - k-평균 알고리즘 작동 방식 설명하기🎉

 

1. 무작위로 k개의 클러스터 중심을 정하기

2. 각 샘플에서 가장 가까운 클러스터 중심을 찾아 해당 클러스터의 샘플로 지정하기

3. 클러스터에 속한 샘플의 평균값으로 클러스터 중심을 변경하기

4. 클러스터 중심에 변화가 없을 때까지 2번으로 돌아가 반복하기

 

🎉기본미션 - Ch.06-3 문제풀고 인증샷🎉

Q1. 특성이 20개인 대량의 데이터셋이 있습니다. 이 데이터셋에서 찾을 수 있는 주성분 개수는 몇개일까요?
A1. 2번 20개

Q2. 샘플 개수가 1000개이고 특성 개수는 100개인 데이터셋이 있습니다. 즉, 이 데이터셋의 크기는 
(1000,100) 입니다. 이 데이터를 사이킷런의 PCA 클래스를 사용해 10개의 주성분을 찾아 변환했습니다.
변환된 데이터셋의 크기는 얼마일까요?
A2. 1번 (1000, 10)

Q3. 2번 문제에서 설명된 분산이 가장 큰 주성분은 몇번째인가요?
A3. 4번 첫번째 주성분