본문 바로가기

분류 전체보기102

Retrieval-Augmented Generation for Large Language Models: A Survey Retrieval-Augmented Generation for Large Language Models: A SurveyLarge Language Models (LLMs) showcase impressive capabilities but encounter challenges like hallucination, outdated knowledge, and non-transparent, untraceable reasoning processes. Retrieval-Augmented Generation (RAG) has emerged as a promising solution byarxiv.org0. AbstractLLM(Large Language Model)은 뛰어난 성과를 보이지만, hallucination, .. 2024. 11. 11.
Marginalize "Marginalize"는 통계학과 확률론에서 주로 사용되는 말로, 하나 또는 그 이상의 변수의 확률분포를 얻기 위해 다변수 확률 분포에서 일부 변수의 영향을 "제거"하는 과정을 의미한다. 이 과정은 다변수 시스템에서 특정 변수에만 집중하고자 할 때 사용된다. 예를 들어, 두 변수 $X$와 $Y$가 있는 결합 확률 분포 $P(X,Y)$가 있다고 가정해보자. 만약 변수 $Y$에 대해서만 관심이 있고, $X$의 영향을 무시하고자 한다면, $X$에 대해 marginalization을 수행하여 $Y$의 주변 확률 분포(marginal probability distribution) $P(Y)$를 다음과 같이 계산할 수 있다.이 식은 모든 가능한 $X$의 값에 대해 결합 확률을 합산하여 $Y$의 확률만을 남기는 것.. 2024. 11. 10.
Music Genre Classification (2) GTZAN Dataset - Music Genre ClassificationAudio Files | Mel Spectrograms | CSV with extracted featureswww.kaggle.comGTZAN 데이터셋은 음악 장르 분류 문제를 다루는 데이터셋입니다. 이 데이터셋은 머신 러닝 및 딥 러닝 알고리즘을 사용하여 음악의 장르를 자동으로 분류하는 모델을 학습하고 평가하는 데 널리 사용됩니다. 이 데이터셋에는 10개의 장르가 포함되어 있으며, 각 장르는 100개의 30초 길이의 오디오 파일로 구성되어 있습니다. 데이터는 원래 Marsyas 소프트웨어 프레임워크의 일부로 제공되었으며, 다양한 연구 및 학습 목적으로 사용됩니다. music: chargenre: charColumnid: 오디오 .. 2024. 11. 7.
Music Genre Classification (1) 1. 음성 데이터 활용음성 데이터는 인공지능 스피커에서의 음성 인식, 유튜브 자막 생성을 위한 오디오 캡셔닝 등 다양한 분야에 활용되고 있습니다. 음성 분야의 최신 기술 동향을 살펴보면, 음성 데이터로부터 handcrafted feature를 추출하여 이를 인공지능 신경망의 입력으로 사용하는 추세입니다. 이를 위해서는 raw data(음성)으로부터 handcrafted feature가 어떻게 기술되는지 알아야 할 필요가 있습니다. 2. 음성 데이터란?기타 줄을 튕기면 순간적으로 줄이 앞뒤로 흔들리게 됩니다. 이 때 줄 주변의 공기도 앞뒤로 흔들리며 주변으로 퍼져나가게 되고, 이렇게 앞뒤로 흔들리며 이동하는 공기가 우리의 청각 기관으로 들어와 고막을 흔들게되면 우리는 소리를 인식하게 되는 것입니다. 소리가.. 2024. 11. 7.