본문 바로가기

Computer Science/Machine Learning43

차원 축소(Dimension Reduction) : PCA (3) 1. 데이터 로드from sklearn.datasets import load_winedata = load_wine()X = data.dataY = data.lable2. 데이터 분할from sklearn.model_selection import train_test_splitX_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.3, random_state=1, stratify=Y)3. 데이터 정규화from sklearn.preprocessing import StandardScalerstd = StandardScaler()X_train_std = std.fit_transform(X_train)X_test_std = std.transfor.. 2024. 6. 9.
차원 축소(Dimension Reduction) : PCA (2) 1. 주성분 분석(PCA)(1) 주성분 분석의 목적차원을 줄이는 비지도 학습 방법 중 한가지사영 후 원 데이터의 분산(variance)을 최대한 보존할 수 있는 기저를 찾아 차원을 줄이는 방법(2) MNIST의 예시(3) 주성분 분석데이터를 사영(projection)시킬 경우 송실괴는 정보의 양이 적은 쪽의 기저(축)를 선택아래 예시의 경우 왼쪽 기저(축)가 오른쪽 기저보다 원데이터의 분산을 최대로 유지하므로 왼쪽의 기저 축을 주성분을 선택하는 것이 좋음 2. 주성분 분석(PCA): 수리적 배경(1) 주성분 분석: 선형 결합데이터(X) 사영 변환 후(Z)에도 분산이 보존하는 기저(a)을 찾는 것(2) 공분산(Covariance) : 변수의 상관 정도X : 입력 데이터 (n개의 데이터, d개의 변수)(3).. 2024. 6. 9.
차원 축소(Dimension Reduction) (1) 1. 데이터 분석 과정머신러닝을 이용한 데이터 분석 과정 2. 차원 축소의 필요성고차원 데이터(High dimensional data)의 예시문서 요약- 예) 한 문서의 크기 → 한 언어의 단어 수로 표현- Billions of Documents * bag of words추천 시스템- 예) 사용자 * 총 영화 수 matrix 로 표현- 480,189 users * 17,770 movie유전자 군집화- 예) 유전자 수 * 유전자의 컨디션- 10,000 genes * 1,000 conditions 3. 차원의 축소 개요(1) 차원의 저주 (Curse of dimensionality)차원이 증가할수록 동일 정보량을 표형하기 위해 필요한 데이터의 수는 지속적으로 증가한다는 의미데이터 학습을 위해 차원이 증가하면.. 2024. 6. 9.
앙상블(Ensemble) [센서데이터를 이용한 행동분류] (2) 0. Overview(1) Task스마트폰에 장착된 자이로센서와 가속도 센서의 1D 센서 데이터(자이로, 가속도)를 사용하여 사람의 행동 유형을 분류 예측1D 센서 데이터를 Feature 로 기술할 수 있습니다.좋은 Feature를 만들수록 분류 성능이 향상됨을 알 수 있습니다.스마트폰은 다양한 센서로 이뤄져있으며, 대표적으로는 가속도 센서와 자이로 센서가 있습니다. 가속도 센서(Accelerometer)는 X,Y,Z 축에 대한 가속도를 측정하는 센서이며, 스마트폰의 움직임을 알 수 있습니다. 다음으로는 자이로 센서(Gyroscope)는 물체의 회전속도를 측정하는 센서이며, 스마트폰의 기울임을 알 수 있습니다. 이외에도 다양한 센서가 존재하지만 해당 실습문제에서는 이 두가지 센서를 활용하게 됩니다.(2).. 2024. 6. 9.