본문 바로가기
  • 紹睿: 자유롭고 더불어 사는 가치있는 삶

Data67

[(빅)데이터 교육] 데이터 분석의 기초 - 데이터 분석 개요 데이터 분석의 기초 (1) 데이터 분석 개요 - 한국데이터베이스진흥원데이터의 시대 Datafication분석이란 무엇인가?결정을 내리고 행동에 옮기기 위해 데이터, 통계 분석과 계량 분석, 설명 모델과 예측모델 등을 폭넓게 활용하는 것 빅데이터 시대의 통계적 사고기술의 융합, 측정의 혁명적 변화, 미래의 의사결정에 관한 관점 혹은 철학 -Steve Lohr, NYT 모집단과 표본빅데이터 시대에도 모집단과 표본이라는 개념이 필요한가?우리가 모든 데이터를 가지고 있다면 왜 표본을 추출해야하는가? 표본 추출은 분석의 난제를 일부 해결한다. 편의(bias)데이터로부터 발견한 어떠한 추론도 해당 사용자 집단 또는 어떤 특정한 날의 사용자들 이외의 다른 사람들에 대한 일반화된 결론으로 확대하는 것을 경계 표본추출표.. 2018. 6. 21.
[(빅)데이터 분석] 데이터 분석의 이해 - 기계학습의 이해 및 데이터 분석 사례 기계학습의 이해 - What is the Machine Learning?1. Supervised Learning - Input Target 의 pair: 이산형 - ClassificationSVMk-NNNaive BayesDecision TreeRandom ForestLogistic RegressionNeural Network: 연속형 - RegressionLinear Regressionk-NNSVMRandom Forest2. Unsupervised Learning- 자율학습 input만: Clusterk-MeansHierarchical clusteringPCA(Principal Component Analysis)Neural Network: AssociationApriori3. reinforcement .. 2018. 6. 20.
[(빅)데이터 교육] 데이터 분석의 이해 - 데이터 분석 방법론 (2) 데이터 분석 방법론 (2) - BIGDATA ACADEMY (한국데이터베이스진흥원)Data Preparing phase EDA(Exploratory Data Analysis)데이터를 있는 그대로 보고 탐색해가기1. Resistance2. Residual3. Re-expression4. Visualization Box plot - 데이터가 말하고자 하는 것을 이해하기 CDA(Confirmatory Data Analysis)유의성 검정/ 신뢰구간 추정 -> 통계적 Data Governance란?전사 차원의 데이터에 대한 정책, 지힘, 표준화 전략을 수집하고 이를 관리하기 위한 조직과 프로세스를 확립, 기업의 가치 창출을 지원하는 체계1. Data 품질관리2. Data 구조관리3. Data 관리 체계=> 데이.. 2018. 6. 20.
[(빅)데이터 교육] 데이터 분석의 이해 - 데이터 분석 방법론 데이터분석에 관하여 공부할 기회가 생겼는데, 이왕 할꺼 열심히 해보려고 한다! 데이터 분석 방법론 - BIGDATA ACADEMY (한국데이터베이스진흥원)방법론(Methodology) 개개인의 역량과 경험에 의존하지 않고 누가 수행하던 "일정 수준의 질과 양"이 보장 될 수 있는 체계(시스템)업무 수행에 대한 최소한의 품질 보증(조직의 역량으로 분석 산출물이 만들어져야 한다) 구성요소 : 절차 / 방법 / 기법 / 표준산출물 - 방법론이 만들어지는 과정: 4단계 순환 1) 암묵적인 지식2) 형식지: 개인별 문서화3) 형식적 지식: 방법론4) 암묵지: 개인별 내제화 방법론 모델:1) 폭포수 모델: 복잡도가 낮고 사례가 많음2) 나선형: 요구사항 충족, 관리부족시 복잡도 상승3) 프로토타입 -> 조직의 특성.. 2018. 6. 20.
[퀵 정렬] quick sort - python 출처:https://ko.wikipedia.org/wiki/%ED%80%B5_%EC%A0%95%EB%A0%AC Quick Sort시간복잡도: 최악 - O(n2), 평균 -O(n log n) 퀵 정렬(quick sort)은 비교 정렬, 불안정 정렬에 속한다. 분할 정복 방법을 통해 리스트를 정렬한다. 1. 리스트 가운데에서 하나의 원소를 고른다. (pivot) 2. 분할: pivot 앞에는 pivot보다 작은 값 pivot 뒤에는 큰 값의 원소들이 오도록 pivot을 기준으로 리스트를 둘로 나눈다. 3. 분할된 리스트는 재귀적으로 반복하여 리스트의 크기가 0이나 1이 될 때까지 반복한다. 123456789101112def quick_sort(x): if len(x) 2018. 6. 19.
[백준 알고리즘] 1181번 단어 정렬 문제알파벳 소문자로 이루어진 N개의 단어가 들어오면 아래와 같은 조건에 따라 정렬하는 프로그램을 작성하시오.길이가 짧은 것부터길이가 같으면 사전 순으로 입력 첫째 줄에 단어의 개수 N이 주어진다. (1≤N≤20,000) 둘째 줄부터 N개의 줄에 걸쳐 알파벳 소문자로 이루어진 단어가 한 줄에 하나씩 주어진다. 주어지는 문자열의 길이는 50을 넘지 않는다. 이문제를 풀기위해.....ㅠ merge sorting을 이용했다. 시간제한이 2초이기 때문에.... 1. 중복된 단어는 뺀다. 2. 글자수가 같으면 알파벳 순서이기 때문에 미리 sort를 해서 정렬해준다. 3. sorting을 단어 길이로 해주자. 꿀 1234567891011121314151617181920212223242526272829303132333.. 2018. 6. 19.