본문 바로가기
  • 紹睿: 자유롭고 더불어 사는 가치있는 삶
Project/음악 가사 분석

[음악 가사 분석2] word2vec을 이용한 음악 가사 클러스터링 (1)

by 징여 2018. 9. 14.
반응형

word2vec이라는 알게 되면서 이번 졸업 논문에 써보겠다 다짐했다.


논문을 준비하면서


음악 정보 검색 기술(Music Information Retrival)

- word2vec

- WMD(Word Mover’s Distance)

- 계층적 군집화(Hierarchical Clustering)

대하여 공부를 해볼 생각이다 ^-`(찡긋)


먼저 word2vec 이용하여 음악 가사를 분석해보겠다고 결심하게 계기는 

어느날 음악을 듣는데, 내가 좋아했던 음악 목록을 듣는데도 별로라는 생각이 들었다
분명히 내가 좋아했던 음악이었는데? 갑자기 듣기 별로였을까?
아마, 과거의 지금의 나의 처한 상황이 달라서 이다

음악을 들을 사람은 자신의 생각과 경험이 반영되어 그것에 공감하며 음악을 듣게 된다.


(
지극히 나의 주관적인생각 ㅋㅋㅋ)

음악, 특히 가요에서는 나는 적어도 음악의 가사에 많은 영향을 받고 있다고 생각한다
그런데, 요즘 스트리밍 서비들에서 추천해주는 음악에는 그것이 조금 반영이 안되고 있는 것같은 느낌이 들었다
그래서 음악 정보 검색 기술들과 현재 스트리밍 음악 추천 서비스들의 상황(?) 살펴 보고자 한다!




음악 추천이란?

최근 음악 스트리밍 서비스들이 늘면서, 음악추천에 대한 관심이 늘고 있다
음악 추천할 때는 음악 정보 검색 기술(Music Information Retrival) 사용된다.


1. 음악 정보 검색 기술(Music Information Retrival)

음악 정보 검색기술은 음원 정보를 분석해서 
    1)
유사한 음악 검색하거나 
    2)
필요한 음원 정보를 찾을때 
활용되는 기술이다.



보통 이러한 검색방법은 검색(searching) 필터링(filtering)으로 구현되는데, 주로 추천시스템에서는 필터링을 이용하여 사용자가 선호할 만한 음악을 추측해 준다고 한다.


대표적으로 필터링을 적요한 사례는

- Lsat.fm

iTunes RSS feed generator

- Amazon.com 등 있다.


음악 정보를 검색하는 방법으로는 

1) 음악 내용(content) 기반한 방법

2) 메타데이터(metadata) 이용하는 방법

3) 집단 지성을 이용하는 방법

으로 나뉜다.


1) 음악의 내용에 기반한 방법

음악 자체의 내용을 분석해 검색하는 방법으로 보통 오디오나 허밍 분석등의 연구가 있다. 음악의 신호를 내용기반으로 분석하기 위해서는 음악의 특징을 대표하는 요소를 추출하는 것이 중요하며, 이게 핵심인것 같다!!


2) 메타데이터를 이용하는 방법

내가 방법이 방법인 같은데!!! 
음원의 파일이나 라이브러이에 포함된 정보를 이용하여 검색하는 방법으로, 보통 제목, 가수 등의 정보를 통해 검색하게 된다.


3) 집단 지성을 활용하는 방법

제일 최근에 사용하는 방법 인것 같은데, 음악을 감상한 유저들의 데이터를 이용하는 방법이다. 기본적으로는 메타데이터를 활용하는 방법으로 속한다.


사실 이러한 방법들을 고루고루 활용하여 음악을 추천해야한다고 생각한다.

필터링 기법이니까, 하나하나 걸러내면 되는거 아닌가? ㅋㅋ.. (아님말구..)


참조

문화기술(CT)심층리포트, 2012 4, kocca 한국콘텐츠진흥원


반응형

댓글