본문 바로가기
  • 紹睿: 자유롭고 더불어 사는 가치있는 삶

Project23

[음악 가사 분석] kaggle 데이터를 이용해여 (3) - ppt자료를 찾았다. 음악 가사 분석 [그때의 기억을 되살리며 작성] 데이터 1.kaggle billboard(1945-2015)라고 쓰고 1965-2015라고 읽는다(데이터에 65년도부터 있었다) 2. melon 1965-2015 멜론과 빌보드차트 두가지를 사용한 것은 한국과 미국의 가사 실태에 대하여 알고 싶은 것이였고, 멜론은 R로 크롤링해서 가져온것으로 기억된다. 그리고 마지막 멜론에서는 가사에 대한 분석보다는 어떤 가수가 주로 등장하였는지를 했던것 같다(아마 시간부족) 주로 나온 10개의 단어 feel, girl, know, like, love, now, one, say, see, time 단순 count에서 차지하는 비율로 바꾸어 비교를 했었다. 보면 느껴지겠지만(사실 글씨가 작아서 안보일듯) 아래것은 그냥 단순 .. 2018. 9. 14.
[음악 가사 분석] Kaggel 데이터를 이용하여 (2) - 결론 및 정리 솔직히, Kaggle 음악 가사 분석했던 건.. 그다지 생각이 안난다. 순서대로 60년대, 70년대, 80년대, 90년대, 00년대, 10년대 (Top 100) 의 주요 가사 내용이다. 전체적으로 Love와 baby가 눈에 띄는걸 볼 수 있다. top100에 속한 노래 대부분이 사랑에 관한 내용이라는걸 알수 있다.그놈의 사랑이야기가 주로 TOP100에 오르락 내리락 한다는걸 알 수 있다. 이건 단편적으로 60년대와 10년대를 비교한 건데, 재밌는점을 찾는다면 10년대로 갈수록 욕설이 많아 진다는 점이다. 사랑과 좋아행~ 자기야 막 이러다가, 갑자기 bitch, money, party, nigga..이런게 눈에띄게 많이 나타났다는 점인데..10년대로 갈수록 사람들이 문란해 지는건가 *^^*..허허허허허허허.. 2018. 9. 14.
[Seoul Store] 내맘대로 하는 서울상가 데이터 탐색기 (2) [Seoul Store] 내맘대로 하는 서울상가 데이터 탐색기 (1): (http://can-do.tistory.com/108?category=778902) Store data in Seoul 2 - 시각화¶서울에 있는 상가 데이터 시각화 해보자 1. folium으로 한번 지도에 그려보자¶ 데이터: store data in seoul 1에 사용했던 데이터를 그대로 사용 할 것이다! In [48]: geo_str = json.load(open('./books/data/02. skorea_municipalities_geo_simple.json', encoding='utf-8')) map = folium.Map(location=[37.5502, 126.982], zoom_start=11) map.choro.. 2018. 7. 16.
[Seoul Store] 내맘대로 하는 서울상가 데이터 탐색기 (1) 심심해서 하는 내맘대로 서울상가 데이터 탐색기 Store data in Seoul¶서울에 있는 상가 데이터를 탐색해보자 In [1]: import pandas as pd import numpy as np import matplotlib.pyplot as plt %matplotlib inline 1. 상가업소정보 201803 데이터 탐색¶ In [3]: data1 = pd.read_csv('./소상공인시장진흥공단_상가업소정보_201803/소상공인시장진흥공단_상가업소정보_201803_01.csv', encoding='cp949') data1.head(3) Out[3]: 상가업소번호 상호명 지점명 상권업종대분류코드 상권업종대분류명 상권업종중분류코드 상권업종중.. 2018. 7. 14.
[서울시 도서관] 서울시 도서관 개수 시각화 In [7]: import pandas as pd import matplotlib.pyplot as plt import numpy as np import folium %matplotlib inline 도서관 데이터 가져오기¶ In [6]: library = pd.read_excel('./data/library.xlsx', skiprows=7) library.head() Out[6]: 도서관명 주소 전화번호 팩스번호 위도 경도 홈페이지 휴관일 도서관코드 0 2.28도서관 대구광역시 중구 2·28길 9 053-257-2280 053-257-2284 35.857981 128.589620 http://www.228lib.or.kr/ 매주 월요일 / 법정공휴일(일요일을 제외한 관공서 공휴일), 도서관 및 기타 .. 2018. 7. 11.
pixel-art :: openCV 기초 (4) - 이미지 임계처리 이미지 임계처리에는 simple thresholding, adaptive thresholding, Otsu's thresholding가 있다. opencv에서는 cv2.threshold(), cv2.adaptiveThreshold()를 이용하면된다. 간-단 기본 임계처리 이진화 처리: 흑/백으로 분류하여 처리하는 것기준이되는 임계값을 정하는 것이 중요하다. 임계값 보다 크면 백, 작으면 흑이 된다.cv2.threshold(src, thresh, maxval, type) → retval, dstsrc – input image(grayscale 이미지)thresh – 임계값maxval – 임계값을 넘었을 때 적용할 valuetype – thresholding typecv2.THRESH_BINARYcv2.TH.. 2018. 3. 6.