본문 바로가기
  • 紹睿: 자유롭고 더불어 사는 가치있는 삶
Project/음악 가사 분석

[음악 가사 분석] Kaggel 데이터를 이용하여 (2) - 결론 및 정리

by 징여 2018. 9. 14.
반응형

솔직히, Kaggle 음악 가사 분석했던 건.. 그다지 생각이 안난다.



순서대로  60년대, 70년대, 80년대, 90년대, 00년대, 10년대 (Top 100) 의 주요 가사 내용이다.


전체적으로 Love와 baby가 눈에 띄는걸 볼 수 있다. top100에 속한 노래 대부분이 사랑에 관한 내용이라는걸 알수 있다.

그놈의 사랑이야기가 주로 TOP100에 오르락 내리락 한다는걸 알 수 있다.







이건 단편적으로 60년대와 10년대를 비교한 건데, 재밌는점을 찾는다면 10년대로 갈수록 욕설이 많아 진다는 점이다.



사랑과 좋아행~ 자기야 막 이러다가, 갑자기 bitch, money, party, nigga..이런게 눈에띄게 많이 나타났다는 점인데..

10년대로 갈수록 사람들이 문란해 지는건가 *^^*..허허허허허허허 멋져



60년대와 비교하면 단어만 봐도 가사에 대한 어느정도 제약이 풀렸고, 그런 단어를 선호한 노래가 많이 유행했다는 것을 갈 수 있다.


또한, 60년대 가사를 보면 여자에 대한 사랑뭐 이런것도 있지만, home, people이런것이 눈에 띄는 걸로 보아 사랑이라는게 공통적인.. 인류애 등을 말하는게 아니였나 싶다.







전체적으로 비교해보기




이걸 혼자 하면서 아쉬웠던 건, 


1. 조동사가 전혀 빠지지 않았다는것. 

이건 부정어를 체크하고 싶었는데, R의 그냥 기존 stopword를 이용해버리면, 다 빠져버려서 그랬던것 같다. 


2.  like가 like to~ 와 전혀 구분히 되어있지 않는다는게.. 그래서 아마 like가 많이 나타나는 걸로 생각 된다.

그때 당시에는 like to와 like를 어떻게 구분하면 좋을지 몰라서 아마 그냥 이럴바에는 다 포함시켜서 분석하자가 된것 같다.



지금 와서 생각하는 거지만, 이러한 걸 제외하지말고 총 합에서 단어의 빈도수를 보고 뺄지말지 결정했어야 되는게 맞지 않나싶다..

ㅋㅋㅋㅋ


뭐 워낙 심심풀이로 하는 거였고, 그래도 이걸 통해서 시대별로 당시 사람들이 자주 들었던 노래의 취향이 무척이나 다르다는걸...알게된 나름 재미있는 프로젝트였다.



벌써 1년이나 지난건데.. 이제와서 정리하다니 ㅠ.ㅠ (사실 못함)


그때당시, tistory를 했으면.. 아마 정리해가면서 하지않았을까 싶다가도 아니었겠지..




반응형

댓글