دانلود مقاله ISI انگلیسی شماره 150564
ترجمه فارسی عنوان مقاله

تجزیه و تحلیل تجربی الگوریتم های خوشه بندی داده ها

عنوان انگلیسی
Empirical Analysis of Data Clustering Algorithms
کد مقاله سال انتشار تعداد صفحات مقاله انگلیسی
150564 2018 10 صفحه PDF
منبع

Publisher : Elsevier - Science Direct (الزویر - ساینس دایرکت)

Journal : Procedia Computer Science, Volume 125, 2018, Pages 770-779

ترجمه کلمات کلیدی
الگوریتم خوشه بندی، ساختار جامعه، یادگیری بی نظیر،
کلمات کلیدی انگلیسی
Clustering algorithms; Community structure; Unsupervised learning;
ترجمه چکیده
خوشه بندی انجام می شود تا بینش هایی را که داده ها را جمع آوری می کند انجام دهد و حجم آن برای تجزیه و تحلیل توسط انسان ها مشکل ساز است. به همین علت، الگوریتم خوشه بندی به عنوان ابزار یادگیری متا برای انجام تجزیه و تحلیل اطلاعات اکتشافی تبدیل شده است. خوشه به عنوان مجموعه ای از اشیاء تعریف شده است که دارای درجه بالایی از شباهت به یکدیگر هستند در مقایسه با اشیاء که در یک مجموعه نیستند. با این حال، ابهام در مورد متریک شباهت مناسب برای خوشه بندی وجود دارد. برای اندازه گیری شباهت از قبیل فاصله اقلیدس، چگالی در فضای داده و غیره، چندین معیار پیشنهاد شده است. خوشه بندی یک مشکل بهینه سازی چند هدفه. در این مقاله رویکردهای مختلف خوشه بندی از منظر نظری مورد بررسی قرار گرفته است تا از ارتباط آنها در زمینه مجموعه داده های عظیم شناخته شده و تجربی آن ها بر پایه های مصنوعی مورد آزمایش قرار گیرد تا نقاط قوت و ضعف آنها را برجسته نمایند.
پیش نمایش مقاله
پیش نمایش مقاله  تجزیه و تحلیل تجربی الگوریتم های خوشه بندی داده ها

چکیده انگلیسی

Clustering is performed to get insights into the data whose volume makes it problematic for analysis by humans. Due to this, clustering algorithms have emerged as meta learning tools for performing exploratory data analysis. A Cluster is defined as a set of objects which have a higher degree of similarity to each other compared to objects not in the same set. However there is ambiguity regarding a suitable similarity metric for clustering. Multiple measures have been proposed related to quantifying similarity such as euclidean distance, density in data space etc. making clustering a multi-objective optimization problem. In this paper, different clustering approaches are studied from the theoretical perspective to understand their relevance in context of massive data-sets and empirically these have been tested on artificial benchmarks to highlight their strengths and weaknesses.