Doing Data Science2 [Doing Data Science] 기계학습 알고리즘 알고리즘이란? 어떤 Task를 달성하기 위한 단계나 법칙을 모은 절차 기계학습 알고리즘? 예측, 분류, 군집화에 사용되며 기계학습 알고리즘은 통계적 모형화와는 다르게, 생성과정을 추론하려는 것이 아니라 가장 정확하게 예측하거나 분류하기 위한 것 통계적 모형과 기계학습 알고리즘 접근 방법상의 차이 1) 모수해석: 모수의 현실적 의미 vs. 블랙박스 모형 2) 신뢰구간: 모수와 추정량에 대해 신뢰구간 및 변동성, 불확설성 도출 vs. 안 따짐 3) 명시적인 가정의 역할: 분포에 대한 가정 vs. 가정 X 어떠한 소프트웨어 공학자보다 통계학을 잘 알고 어떠한 통계학자보다 소프트웨어 공학을 잘 아는 사람 - 조지월스 현재 엄청나게 다양한 알고리즘이 존재한다. 우리는 이러한 알고리즘들을 어떻게 잘 활용하여 문제를.. 2021. 7. 29. [Doing Data Science] EDA 다른 사람을 어떻게 확신시킬 것인지 걱정하기 전에 여러분 스스로에게 일어나는 것을 먼저 이해해야 한다. - 앤드류 겔먼 질문하라. 배경을 연구하라. 가설을 설정하라. 실험으로 가설을 검증하라. 데이터 분석하고 결론을 이끌어내라. 결과를 전달하라. EDA는 도구인 것만큼이나 사고방식 이기도하다. 그 사고방식은 여러분과 데이터의 관계에 대한 것이다. 사용자와 상호작용하며, 더 많은 데이터 생성 피드백 루프를 창출하는 데 있다. 어떤 데이터가 기록하거나 수집될 필요가 있을까? 에서부터 시작하여, 혼돈으로부터 질서를 바로잡으려는 시도를 한다. 나는 분석을 할 때, 고려해야 하는 것은 목표, 그 목표를 달성하기 위한 문제의 정의 그리고 가장 중요한 방향성이라고 생각한다. 회사가 어떤 방향성을 가지고 있느냐에 따라.. 2021. 7. 25. 이전 1 다음