에 대한 반환 값을 사용 scipy.클러스터입니다.는 계층 구조로 구성됩니다.fcluster
-
20-12-2019 - |
문제
가 있다고 가정하겠습니다 네 개의 관찰과 반환 값의 scipy.클러스터입니다.는 계층 구조로 구성됩니다.링크입니다:
[[ 1. 3. 0.08 2. ]
[ 2. 4. 0.28813559 3. ]
[ 0. 5. 1. 4. ]]
이 반환 값을 의미한다:첫 번째 관찰에서 1 과 3 은 병합된 새로운 클러스터 4,그 다음은 관측 2 개의 추가 이 새로운 클러스터를 형성하는 여전히 새로운 클러스터 5.마지막으로 관찰 0 은 클러스터했습니다.문을 얻고 싶은 두 개의 클러스터{1,3,2}과{0},기대 반환 값이[2,1,1,1]것을 의미하는 요소 0 에 속한 클러스터 2 개이고 나머지는 그룹으로 다른 클러스터를 사용하는 1,임계값 0.4.하지만 실제로 scipy.클러스터입니다.는 계층 구조로 구성됩니다.fcluster 반환합니다[3 1,2,1].물론 내가 쓸 수 있는 파이썬 코드를 분석한 결합의 반환하는 2-D 여 배열,자신만 생각 fcluster 기능을 반환 할 수 있습니 내가 무엇을 원하는 경우 임계값을 설정할 0.4.그러나,내가 알지 못하는 방법에 대한 매개 변수를 제공 그것은,그래서 내가 궁금해하는 경우 제공할 수 있습니다 몇 가지 예제 코드는 행위 계층 사용하여 클러스터링 linkage
고 최종 사용하여 결과 fcluster
으로 관찰 그룹에서 클러스터에 의해 표현된 설정합니다.감사합니다.
해결책
fcluster
가 inconsistent
표준으로 인수에 대한 기준을 선택합니다.사 distance
으로 인수하 cophenetic 거리에서 결합 매트릭스 Z[:,2]
.수도 있습 사용 maxclust
으로는 기준을 지정하려는 경우의 수를 클러스터입니다.당신은 클러스터링과 단일 결합,가능성이 어떤 클러스터는 싱글(outliers).도움말(fcluster)제공에 필요한 정보를 사용하는 방법에 대 기능,그렇게 문서