본문 바로가기
  • 紹睿: 자유롭고 더불어 사는 가치있는 삶

Project23

[따릉이] 자전거 도로에 관하여 (2) - 자전거 도로 위치 정보 변환 자전거 도로에 관하여 정보를 받으면 shp, sbn 등을 받게 되는데, 이 아이들을 불러오고 좌표체계를 바꿔주는 코드이다. 자전거 도로 현황에 관한 정보는 자전거 도로에 관하여 (3)에 가면 있다.(3을 먼저 작성해서 ㅎㅎ...) In [30]: import shapefile import pandas as pd from pyproj import Proj, transform 1. shp파일열기¶ In [2]: shp_path = './data/자전거도로/2018년/Bicycle_Lane_Seoul.shp' shp_file = shapefile.Reader(shp_path) fields = [x[0] for x in shp_file.fields][1:] records= shp_file.rec.. 2018. 9. 16.
[따릉이] 자전거 도로에 관하여 (1) - 자전거 도로와 만족도 자전거 도로에 관하여서울시 자전거 이용환경에 대한 만족도는 서울정보소통광장에 가면 받을 수 있다.데이터가 2년단위로 있어서, 2014년과 2016년을 비교했다.(아쉬운 점이 있다면, 따릉이는 2015년에 시행된 서비스라는점이다.) 무튼, 결과를 보면 자전거 도로가 증가했음에도 불구하고 만족도는 전혀 향상되지않았다. 141.5km가 증가했음에도 불구하고 만족도는 6.4점으로 동일했으며 수치를 보면 알겠지만, 자전거우선도로가 급격히 늘어났다는 것을 알 수 있다. 2014년도에는 자전거전용차로, 자전거전용도로, 자전거보행자겸용도로 3가지밖이없었는데, 2016년도에는 자전거우선도로라는 것이 생겼다.이 자전거도로들의 차이는 무엇일까? (녹색교통운동에서 가져옴) 1. 자전거전용도로자전거만 통행할 수 있도록 분리대/.. 2018. 9. 16.
[따릉이] 따릉이 데이터에 관하여 (1) - 따릉이 데이터를 이용하게 된 이유 사실 내가 따릉이 데이터에 관심갖게 된 이유는 단순했다. 불!편!해!서! 길거리를 점령하고 있는 따릉이.......길가는데 너무 불편했다. 대체 따릉이가 뭐길래. 이런가 싶어서 찾아봤는데, 나름 좋은 아이였다. 서울시에서 하는 공공 자전거 서비스인데 이걸 활용해서 자전거를 대중교통 수단화 하겠다! 는 나름의 포부를 안고있는 아이였다. 당시 프로젝트를 함께 할 아이들과 의견을 핑퐁해서 따릉이를 활용해 데이터 분석을 해보면 어떻겠냐고 제안했고 OKOK 싸인을 받아 우리의 따릉이 프로젝트가 시작되었다.(나중에 공모전 발표할때, 썼던 PPT인데, 보면 알겠지만 나중에는 따릉이가 마음에 들어서 AI로 따릉이 까지 그렸다..헤헤헤) 프로젝트를 진행하기 위해 따릉이에 대해서 알아보던 중, 따릉이가 가지고 있는 나름의.. 2018. 9. 14.
[음악 가사 분석2] word2vec을 이용한 음악 가사 클러스터링(3) - WMD란? wmd(word mover’s distace)란간단하게 이야기 하면 공통된 단어가 없는 경우에도 두 문장 간의 거리를 평가할 수 있는 방법이다.아래와 같이 공통된 단어가 없을 경우 관련 단어를 일치시키면서 두 문장간의 유사성을 측정할 수 있다. 이미지출처: http://proceedings.mlr.press/v37/kusnerb15.pdf wmd를 이용하기 위해서는 word embedding 단어 사전이 필요하다. word mover's distance! 논문을 정리해보자 *^^* 1) nBOW representation 다음 두 문장을 비교해 보자. S1 - Obama speaks to the media in Illinois S2 - The President greets the press in Chic.. 2018. 9. 14.
[음악 가사 분석2] word2vec을 이용한 음악 가사 클러스터링(2) - word2vec이란? word2vec대하여 알아 볼 생각이다. word2vec word2vec은 간단하게 말하자면 2013년 구글이 제안한 방법을 구현한 알고리즘으로 word embedding 학습 모형이다. 먼저 word2vec을 알아 보기전에 word2vec의 전신이 되는 아이들 부터 살펴보도록 해보자. word embedding? 우리가 다루어야할 음악 가사는 NLP(Natural Language Processing,자연어 처리)로 컴퓨터가 인간이 사용하는 언어를 이해하고 분석할 수 있게 하는 분야를 이야기한다. 컴퓨터는 단어 자체를 사람처럼 개념적인 차이로 이해하는 것이 아니다. 컴퓨터가 어떤 단어인지 인지 할 수 있게 하기 위해서는 수치적인 방식으로 단어를 나타내 주여야 한다. 수화를 통해 단어의 개념적인 차이를 나.. 2018. 9. 14.
[음악 가사 분석2] word2vec을 이용한 음악 가사 클러스터링 (1) word2vec이라는 걸 알게 되면서 꼭 이번 졸업 논문에 써보겠다 다짐했다.논문을 준비하면서… 음악 정보 검색 기술(Music Information Retrival)- word2vec- WMD(Word Mover’s Distance)- 계층적 군집화(Hierarchical Clustering)에 대하여 공부를 해볼 생각이다 ^-`(찡긋) 먼저 word2vec을 이용하여 음악 가사를 분석해보겠다고 결심하게 된 계기는 어느날 음악을 듣는데, 내가 좋아했던 음악 목록을 듣는데도 별로라는 생각이 들었다. 분명히 내가 좋아했던 음악이었는데? 왜 갑자기 듣기 별로였을까? 아마, 과거의 나 와 지금의 나의 처한 상황이 달라서 이다. 음악을 들을 때 사람은 자신의 생각과 경험이 반영되어 그것에 공감하며 음악을 듣게 .. 2018. 9. 14.