본문 바로가기
  • 紹睿: 자유롭고 더불어 사는 가치있는 삶

Data67

[Doing Data Science] EDA 다른 사람을 어떻게 확신시킬 것인지 걱정하기 전에 여러분 스스로에게 일어나는 것을 먼저 이해해야 한다. - 앤드류 겔먼 질문하라. 배경을 연구하라. 가설을 설정하라. 실험으로 가설을 검증하라. 데이터 분석하고 결론을 이끌어내라. 결과를 전달하라. EDA는 도구인 것만큼이나 사고방식 이기도하다. 그 사고방식은 여러분과 데이터의 관계에 대한 것이다. 사용자와 상호작용하며, 더 많은 데이터 생성 피드백 루프를 창출하는 데 있다. 어떤 데이터가 기록하거나 수집될 필요가 있을까? 에서부터 시작하여, 혼돈으로부터 질서를 바로잡으려는 시도를 한다. 나는 분석을 할 때, 고려해야 하는 것은 목표, 그 목표를 달성하기 위한 문제의 정의 그리고 가장 중요한 방향성이라고 생각한다. 회사가 어떤 방향성을 가지고 있느냐에 따라.. 2021. 7. 25.
HiPPO ? 4차 산업혁명 시대, 독불장군은 필요없다 "4차 산업혁명 시대, 독불장군은 필요없다" 앤드루 맥아피 MIT 수석연구원 "기계 의사결정능력 인간 따라잡아" www.mk.co.kr 맥아피 수석연구원은 "이세돌은 직관적이고 창의적인 바둑의 황제였다. 비교하자면 그의 수는 하이포(HiPPO)였지만 알파고는 데이터에 기반해 그보다 더 뛰어난 수를 둔 것"이라고 말했다. 리더들의 직관과 창의력보다 데이터에 기반한 선택이 더 창의적이고 혁신적일 수 있다는 것이다. 그는 "'기계는 루틴한 일을 하게 하고 사람은 의사결정을 하게 하라'는 전략은 낡은 것"이라며 "앞으로는 기계가 인간만큼 의사결정 능력을 갖추게 될 것임을 깨달아야 한다"고 전했다. HIPPO가 결정하는 시대는 갔다 'HIPPO'가 결정하는 시대는 갔다 -.. 2021. 7. 20.
[추천 시스템] 주요 회사 알고리즘 정리 Facebook Edge Rank Algorithm 우선순위 매기는 알고리즘 3가지 기준의 점수 부여 1. 친밀도 (Affinity): 사용자와 게시글을 작성한 작성자 간의 관계 사용자 측면: 작성자의 다른 게시물에 대한 반응 작성자 측면: 사용자의 게시물에 대한 반응 사용자 작성자 간의 메신저 이용도 2. 가중치 (Weight): 과거 사용자가 반응한 게시물과 현재 평가하고자 하는 게시물의 유사성과 게시물에 대한 반응 우선순위로 가중치계산 필요 3. 시간 (Decay): 게시물 작성된 시간, 마지막 반응시간, 관계를 맺은 시기 등 4. 그외 스토리 범핑(Story Bumping) 라스트 액터(Last Actor) 사용자가 직접 먼저보기 버튼을 통해 노출 Netflix Cine-match Algorith.. 2021. 5. 21.
[Graph] 최단경로검색, Dijkstra algorithm(다익스트라) Dijkstra algorithm(다익스트라 알고리즘) 열심히 그렸는데, 맞겠지. stack에 값을 넣어놓고 pop해서 꺼내면 된다. *A에서 D로 가는 경우, A에서 B를 거쳐 D로 가게되면 8이 됨으로, 7A를 저장해 준다. class Graph: def __init__(self): self.node = set() self.edges = {} self.distances = {} def add_node(self, value): self.nodes.add(value) def add_edge(self, from_node, to_node, distance): self._add_edge(from_node, to_node, distance) self._add_edge(to_node, from_node, dist.. 2018. 9. 25.
[Graph] BFS(Breadth first Search), 넓이우선탐색 [Graph] DFS(Depth first Search), 깊이우선탐색에서는 stack을 이용하고, BFS에서는 queue를 이용하면 된다. vertextList = [0, 1, 2, 3, 4, 5, 6] edgeList = [(0, 1), (1, 0), (0, 2), (2, 0), (1, 3), (3, 1), (2, 4), (4, 2), (2, 5), (5, 2), (4, 6), (6, 4)] graphs = (vertextList, edgeList) def bfs(graph, start): vertextList, edgeList = graph visitedVertex = [] queue = [start] adjacencyList = [[] for vertex in vertextList] for edg.. 2018. 9. 25.
[Graph] DFS(Depth First Search), 깊이우선탐색 DFS, 깊이우선탐색은 게임에서 주로 많이 쓰인다. 먼저, vertextList, edgeList를 만들어 adjacencyList를 만들어 준다. adjacencyList를 만들어 주면 DFS를 이용할 수 있다 ^_^ [[1, 2], 2018. 9. 24.