패션 아이템의 특성 태그 기반 유사도 측정 #가중치
이전 글에 이어서 가중치에 대해 적어보고자 한다. 부모를 따라서 트리를 올라갈 때 가장 먼저 만나는 '목차' 노드의 높이를 기준으로 가중치를 상대적으로 매긴다고 앞서 얘기했는데, 그 방법은 다음과 같다. 우선 정의 하나를 한다. - 부모를 따라갈때 가장 먼저 만나는 '목차' 노드의 높이를 0 이라고 한다. 1. 가중치의 ' 기준 값 ' 은 두 상품이 겹치는 leaf 노드로 부터 '목차' 노드까지의 거리로 한다. 2. leaf 노드에서 '목차' 노드까지 올라가면서 각각의 노드는, 1 / (가중치의 기준 값 + ( 기준 값 - 해당 노드의 높이)) 로 하는 가중치를 갖는다. 3. 즉 가중치 H 는 기준 값 n 을 받아 다음과 같이 계산된다. 다시 밑의 그림을 보면서 따라가 보자. 만약 두 상품이 겹치는 leaf 노드가 '32' 이고 이를 통해 태그 트리 root 까지 그린 것이 위 이미지와 같다고 할 때, 위 경우에서 '사용자' 태그, 루트 노드 가 '목차' 노드라고 한다면, '32' 태그의 기준 값은 4, 높이는 4가 되고, '중반' 태그의 기준 값은 4, 높이는 3가 되고, '30대' 태그의 기준 값은 4, 높이는 2가 되고, '연령대' 태그의 기준값은 4, 높이는 1이 되고, '사용자' 태그의 기준값은 4, 높이는 0가 된다. 이때 '32' 태그의 가중치는 1/ (4+(4-4)) = 1/4 '중반' 태그의 가중치는 1/ (4+(4-3)) = 1/5 '30대' 태그의 가중치는 1/ (4+(4-2)) = 1/6 '연령대' 태그의 가중치는 1/ (4+(4-1)) = 1/7 사용자 태그의 가중치는 1/