차원 축소(Dimension Reduction) : PCA (3)

1. 데이터 로드

from sklearn.datasets import load_wine

data = load_wine()
X = data.data
Y = data.lable

2. 데이터 분할

from sklearn.model_selection import train_test_split

X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.3, random_state=1, stratify=Y)

3. 데이터 정규화

from sklearn.preprocessing import StandardScaler

std = StandardScaler()
X_train_std = std.fit_transform(X_train)
X_test_std = std.transform(X_test)

4. 데이터 차원 축소

from sklearn.decomposition import PCA

lpca = PCA(n_components=4)
X_train_pca = lpca.fit_transform(X_train_std)
X_test_pca = lpca.transform(X_test_std)

5. 모델 학습

from sklearn.linear_model import LogisticRegression

lr = LogisticRegression()
lr.fit(X_train_pca, Y_train)
Y_train_pred = lr.predict(X_train_pca)
Y_test_pred = lr.predict(X_test_pca)

from sklearn import metrics
print(metrics.accuracy_score(Y_train, Y_train_pred))
print(metrics.accuracy_score(Y_train, Y_test_pred))
print(metrics.confusion_matrix(Y_test, Y_test_pred))

6. PCA 주축의 수 결정법

'Computer Science > Machine Learning' 카테고리의 다른 글

Feature Extract : NLP [한국어 텍스트 데이터를 활용한 영화 리뷰 분류] (1) (2)	2024.06.10
차원 축소(Dimension Reduction) : 기타 (4) (0)	2024.06.09
차원 축소(Dimension Reduction) : PCA (2) (0)	2024.06.09
차원 축소(Dimension Reduction) (1) (0)	2024.06.09
앙상블(Ensemble) [센서데이터를 이용한 행동분류] (2) (0)	2024.06.09

차원 축소(Dimension Reduction) : PCA (3)

1. 데이터 로드

2. 데이터 분할

3. 데이터 정규화

4. 데이터 차원 축소

5. 모델 학습

6. PCA 주축의 수 결정법

'Computer Science > Machine Learning' 카테고리의 다른 글

관련글

티스토리툴바