marea: Marea/marea_cluster.py comparison

comparison Marea/marea_cluster.py @ 42:b3f9e13bf15f draft

Uploaded

author	bimib
date	Tue, 03 Dec 2019 12:34:30 -0500
parents	2a082b4aed02
children

comparison

equal deleted inserted replaced

-:9e02d127887a
+:b3f9e13bf15f
 import sys
 import argparse
 import os
 from sklearn.datasets import make_blobs
 from sklearn.cluster import KMeans, DBSCAN, AgglomerativeClustering
-from sklearn.metrics import silhouette_samples, silhouette_score, davies_bouldin_score, cluster
+from sklearn.metrics import silhouette_samples, silhouette_score, cluster
 import matplotlib
 matplotlib.use('agg')
 import matplotlib.pyplot as plt
 import scipy.cluster.hierarchy as shc
 import matplotlib.cm as cm
 if not os.path.exists('clustering'):
 os.makedirs('clustering')
 plt.figure(figsize=(10, 7))
-plt.title("Classes Dendogram")
+plt.title("Customer Dendograms")
 shc.dendrogram(shc.linkage(dataset, method='ward'), labels=dataset.index.values.tolist())
 fig = plt.gcf()
 fig.savefig('clustering/dendogram.png', dpi=200)
 range_n_clusters = [i for i in range(k_min, k_max+1)]
 scores = []
 labels = []
-for n_clusters in range_n_clusters:
+n_classi = dataset.shape[0]
+for n_clusters in range_n_clusters:
 cluster = AgglomerativeClustering(n_clusters=n_clusters, affinity='euclidean', linkage='ward')
 cluster.fit_predict(dataset)
 cluster_labels = cluster.labels_
 labels.append(cluster_labels)
 write_to_csv(dataset, cluster_labels, 'clustering/hierarchical_with_' + str(n_clusters) + '_clusters.tsv')
 best = max_index(scores) + k_min
 for i in range(len(labels)):
 prefix = ''
 if (i + k_min == best):
 for i in X.columns:
 tmp = X[i][0]
 if tmp == None:
 X = X.drop(columns=[i])
+if args.k_max != None:
+numero_classi = X.shape[0]
+while args.k_max >= numero_classi:
+err = 'Skipping k = ' + str(args.k_max) + ' since it is >= number of classes of dataset'
+warning(err)
+args.k_max = args.k_max - 1
 if args.cluster_type == 'kmeans':
 kmeans(args.k_min, args.k_max, X, args.elbow, args.silhouette, args.best_cluster)

Mercurial > repos > bimib > marea

comparison Marea/marea_cluster.py @ 42:b3f9e13bf15f draft