본문 바로가기

분류5

Feature Extract : Speech [영어 음성 국제 분류] (5) 1. 학습 및 제출에 사용할 csv 파일 불러오기DATA_PATH = 'english_voice_classification'pd_train = pd.read_csv('train.csv')pd_test = pd.read_csv('test.csv')print(pd_train.info(), pd_test.info()) 2. 데이터 불러오기 및 Handcrafted-Feature 추출import librosaimport glob, pickleimport numpy as npfrom sklearn.model_selection import train_test_splitfrom sklearn.metrics import accuracy_scoreimport matplotlib.pyplot as pltimport lib.. 2024. 6. 10.
Feature Extract : Speech [음악 장르 분류] (4) 1. 음악 데이터 재생# Ipython 라이브러리를 이용해 학습에 사용될 음성을 직접 들어볼 수 있습니다.from IPython.display import Audio, displayfilename = '/kaggle/input/2024-ml-project4/train/train_000.wav'y, sr = librosa.load(filename)audio_wdt = Audio(data=y,rate=sr)display(audio_wdt) 2. 학습 및 제출에 사용할 csv 파일 불러오기# 학습할 음악들의 장르 정답 csv 파일 불러오기train_info_csv = pd.read_csv('train_labels.csv')# 제출에 사용할 csv 파일 불러오기submit = pd.read_csv('submit.. 2024. 6. 10.
Feature Extract : Speech [음악 장르 분류] (3) 0. Overview(1) 목적본 프로젝트를 통해 음성 데이터를 handcrafted feature로 기술하는 법을 알 수 있다.기술한 feature를 활용하여 음악의 장르를 분류할 수 있다. (2) 데이터셋음성/음악 데이터 다루기 - 장르 분류기본 텀프로젝트에서는 음악 데이터에 대한 양질의 handcrafted feature를 추출하여 총 10가지의 음악 장르를 분류하는 것을 목표로 합니다.1) 음성 데이터 사전 지식음성 데이터 활용음성 데이터는 인공지능 스피커에서의 음성 인식, 유튜브 자막 생성을 위한 오디오 캡셔닝 등 다양한 분야에 활용되고 있습니다. 음성 분야의 최신 기술 동향을 살펴보면, 음성 데이터로부터 handcrafted feature를 추출하여 이를 인공지능 신경망의 입력으로 사용하는 추.. 2024. 6. 10.
Feature Extract : NLP [한국어 텍스트 데이터를 활용한 영화 리뷰 분류] (2) preds = clf.predict(x_test_tfidf)​########################################################################################### Empty Module #6# 입력: BoW 형태로 변환된 (N, M) 크기의 데이터# 출력: 등장 빈도가 적은 단어들을 제외한 (N, m) 크기의 더 작은 데이터# 힌트# 1. 먼저 전체 데이터에서 각 단어가 등장한 횟수를 세어보세요.# 2. 그 다음, 등장 횟수가 50회 미만인 단어들을 찾습니다.# 3. 해당 단어들을 데이터에서 제거하는 코드를 작성합니다.# 4. 설계를 잘 하고 구현을 시작해야 어렵지 않습니다.######################################.. 2024. 6. 10.