본문 바로가기
  • 紹睿: 자유롭고 더불어 사는 가치있는 삶
Project/음악 가사 분석

[음악 가사 분석] kaggle 데이터를 이용해여 (3) - ppt자료를 찾았다.

by 징여 2018. 9. 14.
반응형


음악 가사 분석


[그때의 기억을 되살리며 작성]



데이터 


1.kaggle billboard(1945-2015)라고 쓰고 1965-2015라고 읽는다

(데이터에 65년도부터 있었다)


2. melon 1965-2015



멜론과 빌보드차트 두가지를 사용한 것은 한국과 미국의 가사 실태에 대하여 알고 싶은 것이였고, 

멜론은 R로 크롤링해서 가져온것으로 기억된다.


그리고 마지막 멜론에서는 가사에 대한 분석보다는 어떤 가수가 주로 등장하였는지를 했던것 같다(아마 시간부족)




주로 나온 10개의 단어


feel, girl, know, like, love, now, one, say, see, time 

 단순 count에서 차지하는 비율로 바꾸어 비교를 했었다.



보면 느껴지겠지만(사실 글씨가 작아서 안보일듯)



아래것은 그냥 단순 count로 비교를 했을때인데, 


단순 count에서 비율로 바꾼이유는

각 시대별 데이터의 수가 각기 달랐기 때문에, 당연히 데이터가 많은 쪽의 count가 더 많기 떄문에였고.. 


이를 수정해서 보면, 오른쪽 그림과 같아진다.




재밌는 사실은 love 단어인데, 초반에는 엄청 유행하다가. 어느순간 보면, 확 줄고 있는 것을 볼 수 있다.


그냥, 내 옛날 기억과 비교해봐도.. 예전에는 엄청 사랑얘기가 많았는데 요즘 별로 없...지않나?


이 부분은 [음악 가사 분석] (2) 를 참고..



이게 아마, 멜론의 그냥 가수 분석(?이라고 하기 민망하지만,)이 었을텐데


top100인지 아닌지 잘 기억이 안난다


무튼, 그 시대별 등장 횟수인데, 

조용필과 이선희는 80년대에 인기를 누리고.. 2010년대에도 인기를 누리고 있다.


아마 인연이랑 바운스 때문이었겠지 ㅎㅎ




꾸준히, 사랑받은 사람들도 알 수 있고, 평균 수명(?) 가수가 그 시대에 얼마나 top 순위에 들었냐에 따라, 어느정도 그 기간을 유지하는지도 대충 알 수 있다.


버스커버스커도 엄청 대단하다 생각했는데... sg워너비가 그보다 우위인걸 보면...WoW


게다가 조용필의 80년대 엄~~~~청 나게 유명하셨을 것 같다...



지금 와서 느끼는거지만, 사람들의 취향, 시대 상황이 반영되어있는 음악 가사이기 때문에(top100이니까!)

기회가 된다면, 음악 가사를 고려한 음악 추천을 꼭 해보고 싶다..

반응형

댓글