دانلود مقاله ISI انگلیسی شماره 79070
ترجمه فارسی عنوان مقاله

مطالعه مقایسه ای روش های مقدار دهی اولیه کارآمد برای الگوریتم خوشه بندی k-means

عنوان انگلیسی
A comparative study of efficient initialization methods for the k-means clustering algorithm
کد مقاله سال انتشار تعداد صفحات مقاله انگلیسی
79070 2013 11 صفحه PDF
منبع

Publisher : Elsevier - Science Direct (الزویر - ساینس دایرکت)

Journal : Expert Systems with Applications, Volume 40, Issue 1, January 2013, Pages 200–210

ترجمه کلمات کلیدی
خوشه بندی Partitional؛ مجموع معیار مربع خطا؛ K-means - مقدار دهی اولیه مرکز خوشه
کلمات کلیدی انگلیسی
Partitional clustering; Sum of squared error criterion; k-means; Cluster center initialization
پیش نمایش مقاله
پیش نمایش مقاله  مطالعه مقایسه ای روش های مقدار دهی اولیه کارآمد برای الگوریتم خوشه بندی k-means

چکیده انگلیسی

K-means is undoubtedly the most widely used partitional clustering algorithm. Unfortunately, due to its gradient descent nature, this algorithm is highly sensitive to the initial placement of the cluster centers. Numerous initialization methods have been proposed to address this problem. In this paper, we first present an overview of these methods with an emphasis on their computational efficiency. We then compare eight commonly used linear time complexity initialization methods on a large and diverse collection of data sets using various performance criteria. Finally, we analyze the experimental results using non-parametric statistical tests and provide recommendations for practitioners. We demonstrate that popular initialization methods often perform poorly and that there are in fact strong alternatives to these methods.