본문 바로가기

Audio2

Music Genre Classification (2) GTZAN Dataset - Music Genre ClassificationAudio Files | Mel Spectrograms | CSV with extracted featureswww.kaggle.comGTZAN 데이터셋은 음악 장르 분류 문제를 다루는 데이터셋입니다. 이 데이터셋은 머신 러닝 및 딥 러닝 알고리즘을 사용하여 음악의 장르를 자동으로 분류하는 모델을 학습하고 평가하는 데 널리 사용됩니다. 이 데이터셋에는 10개의 장르가 포함되어 있으며, 각 장르는 100개의 30초 길이의 오디오 파일로 구성되어 있습니다. 데이터는 원래 Marsyas 소프트웨어 프레임워크의 일부로 제공되었으며, 다양한 연구 및 학습 목적으로 사용됩니다. music: chargenre: charColumnid: 오디오 .. 2024. 11. 7.
Music Genre Classification (1) 1. 음성 데이터 활용음성 데이터는 인공지능 스피커에서의 음성 인식, 유튜브 자막 생성을 위한 오디오 캡셔닝 등 다양한 분야에 활용되고 있습니다. 음성 분야의 최신 기술 동향을 살펴보면, 음성 데이터로부터 handcrafted feature를 추출하여 이를 인공지능 신경망의 입력으로 사용하는 추세입니다. 이를 위해서는 raw data(음성)으로부터 handcrafted feature가 어떻게 기술되는지 알아야 할 필요가 있습니다. 2. 음성 데이터란?기타 줄을 튕기면 순간적으로 줄이 앞뒤로 흔들리게 됩니다. 이 때 줄 주변의 공기도 앞뒤로 흔들리며 주변으로 퍼져나가게 되고, 이렇게 앞뒤로 흔들리며 이동하는 공기가 우리의 청각 기관으로 들어와 고막을 흔들게되면 우리는 소리를 인식하게 되는 것입니다. 소리가.. 2024. 11. 7.