Technological Deep Dive

How to Get into the Tech

유사도 2

[NA] #3 네트워크와 커뮤니티(Community Structure in Networks)

지난 포스팅에서는 네트워크의 특성을 노드 수준에서 정량적으로 측정하는 여러 중심성 지수들을 살펴보았습니다. '중심성' 지수가 네트워크에서 중요한 노드가 무엇인지를 찾아낼 수 있도록 도왔다면, 네트워크 내의 Community Structure는 '서로간에 밀접하게(densely) 연결된 노드들의 집합'을 구분할 수 있도록 합니다. 밀접하게 연결된다는 것은 무엇을 의미할까요?  오늘은 이에 대한 실마리를 얻기 위해 네트워크의 유사도와 군집도 그리고 Community를 탐지하는 기본 아이디어에 대해 알아보도록 하겠습니다. Community Structure in Networks우리는 종종 네트워크를 도식화할 때, 아래 그림과 같은 형태로 나타내곤 합니다. 왜 이러한 그림이 '네트워크'라는 개념의 상징적인 이미..

[TA] #3 나는 누구랑 얼마나 닮았을까? - 유사도 측정

* This content is based on the article written by Ji Ho Park and Gichang Lee* This content is based on the lecture content of Prof. Pilsung Kang요약1. 사람들이 인식하는 문서의 유사도는 주로 문서들 간에 동일한 단어 또는 비슷한 단어가 얼마나 공통적으로 많이 사용되었는가에 의존2. 일반적인 문서 유사도 계산 과정은, (1) 전처리, (2) 임베딩, (3) 벡터 간 유사도 계산3. 일반적으로 문서 유사도 계산시 가장 많이 쓰이는 방법은 cosine similarity (코사인 유사도)4. 유사도는 정보 검색, 문서 분류, 추천 시스템 등 다양한 응용 분야에서 활용 본 포스팅에서는 단어 표현 방..

728x90
반응형