0
0 комментариев

Пытаюсь реализовать кластеризацию погодных данных методом k-means, раньше питоном не занимался,не могу сделать вывод данных в excel файл для дальнейшего анализа.

import numpy as np
import matplotlib.pyplot as plt
 import pandas as pd
from sklearn import preprocessing
from sklearn.cluster import KMeans
from sklearn.preprocessing import MinMaxScaler, StandardScaler
from sklearn.datasets import make_blobs
from sklearn.preprocessing import Imputer
   # read data (drop last empty column, caused by an extra (last) colon in the header)
data = pd.read_csv('D:\маг-а\Документы ДИПЛОМ\данные\APX.csv', engine='python', sep=';', index_col=False).dropna(axis=1, how='all')
   # normalize data
scaler = StandardScaler()
X = preprocessing.scale(data)
# clustering
n_clusters = 5
km = KMeans(n_clusters=n_clusters)
   # fit & predict clusters
data['cluster'] = km.fit_predict(X)
   # results - we should have 5 clusters: [0,1,2,3,4]
print(data)
   # cluster's centroids
print(km.cluster_centers_)
 #image clusters
plt.figure(figsize=(12, 12))
X = pd.read_csv('D:\маг-а\Документы ДИПЛОМ\данные\APX.csv', engine='python', sep=';', index_col=False).as_matrix()
 y_pred = KMeans(n_clusters=5).fit_predict(X)
 plt.subplot(221)
plt.scatter(X[:, 0], X[:, 1], c=y_pred)
plt.title("Incorrect Number of Blobs")
plt.show()

Asked question
Добавить комментарий