Portanto, tenho esse vetor e quero agrupá-los com agrupamento K-Means simples, mas primeiro preciso procurar o agrupamento k ideal com o método Elbow. Eu uso a função KElbowVisualizer do pacote YellowBrick para encontrar o k-cluster ideal. O problema é que tenho 569 vetores, e o gráfico do KElbowVisualizer não era grande o suficiente para visualizá-los; portanto, não consigo ver qual é o melhor k-cluster que existe.
Procurei o código para definir o tamanho do lote, mas não funcionou. Aqui está o resultado do gráfico:
e aqui está o meu código:
from sklearn.cluster import MiniBatchKMeans
from sklearn.feature_extraction.text import TfidfVectorizer
from yellowbrick.cluster import KElbowVisualizer
vec = TfidfVectorizer(
stop_words = 'english',
use_idf=True
)
vectors_= vec.fit_transform(df1)
model = MiniBatchKMeans()
titleKElbow = "The Optimal K-Cluster with Elbow Method"
visualizer = KElbowVisualizer(model, k=(2,30), metric='silhouette', timings=False, title = titleKElbow, size=(1080, 720))
visualizer.fit(vectors_)
visualizer.show(outpath="G:/My Drive/0. Thesis/Results/kelbow_minibatchkmeans.pdf")
Não consegui nem salvá-lo no meu diretório com a última linha do meu código. Alguém tem alguma ideia de como consertar? Obrigado
resposta: basta instalar a última versão do Yellowbrick com pip install -U yellowbrick
.
não se esqueça de definir o tamanho do gráfico KElbowVisualizer para que você possa ver o k-cluster ideal em detalhes
Este artigo é coletado da Internet.
Se houver alguma infração, entre em [email protected] Delete.
deixe-me dizer algumas palavras