Es impresionante como ajustando los hiperparámetros se pueden identificar perfectamente tanto los “k” como los outliers.
dbscan_blobs = DBSCAN(eps=0.8, min_samples=4)
y_predict = dbscan_blobs.fit_predict(X)
df_blobs['cluster'] = y_predict
sns.scatterplot(data=df_blobs, x='x1', y='x2', hue='cluster', palette='bright');
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?