본문 바로가기

Computer Science71

KNN(K-Nearest Neighbors) [영화 평점 예측] (3) KNN 회귀 KNN 회귀를 이용한 영화 평점 예측 평이 좋다” vs “평이 나쁘다” 레이블로 분류하는 게 아니라 실제 IMDb(인터넷 영화 데이터베이스) 등급(별점)을 예측 from sklearn.neighbors import KNeighborsRegressor regressor = KNeighborsRegressor(n_neighbors=3, weights="distance") # uniform: 단순평균(default) / distance: 가중평균 training_points = [ [0.5, 0.2, 0.1], [0.9, 0.7, 0.3], [0.4, 0.5, 0.7] ] training_labels = [5.0, 6.8, 9.0] regressor.fit(training_points, train.. 2024. 3. 22.
KNN(K-Nearest Neighbors) (2) 1. 기계학습 순서 ① 데이터셋 불러오기 ② Label map 제작 ③ 데이터 분할 (train과 test로 나누기) ④ (옵션) 입력 데이터의 표준화 ⑤ 모형 추정 혹은 사례 중심 학습 ⑥ 결과 분석 (confusion matrix로 확인) 2. Iris 데이터셋 불러오기 import seaborn as sns iris=sns.load_dataset('iris') print(iris.head()) # 최초 5개의 관측치를 print print(iris.shape) # iris data의 행과 열의 수 X = iris.drop('species', axis=1) # 'species' 열을 drop하고 input X를 정의 print(X.shape) y = iris['species'] # 'species'열.. 2024. 3. 22.
KNN(K-Nearest Neighbors) (1) 0. 분류와 회귀 (1) 지도학습의 대표적인 머신러닝 방법 분류 (classification) 회귀 (regression) (2) Classification 미리 정의된 여러 class label 중 하나를 예측 (ex. 얼굴인식, 숫자판별(MNIST) 등) Binary classification(이진 분류) : 두 class로 분류 Multiclass classification(다중 분류) : 셋 이상의 class로 분류 (3) Regression 연속적인 숫자 또는 부동소수점수(실수)를 예측하는 것 (ex. 주식 가격을 예측하여 수익을 내는 알고리즘 등) 1. KNN의 개념 (1) KNN이란? 게으른 학습(lazy learner) 또는 사례 중심 학습(instance-based learning) 더보.. 2024. 3. 21.