دانلود مقاله ISI انگلیسی شماره 107960
ترجمه فارسی عنوان مقاله

مجموعه تلفیقی گسسته برای معادن، جریانهای داده ای را با ریزش مفهوم نامناسب مقایسه می کند

عنوان انگلیسی
The Gradual Resampling Ensemble for mining imbalanced data streams with concept drift
کد مقاله سال انتشار تعداد صفحات مقاله انگلیسی
107960 2018 32 صفحه PDF
منبع

Publisher : Elsevier - Science Direct (الزویر - ساینس دایرکت)

Journal : Neurocomputing, Volume 286, 19 April 2018, Pages 150-166

ترجمه کلمات کلیدی
مفهوم رانش معدن داده جریان دسته بندی گروهی، عدم تعادل کلاس،
کلمات کلیدی انگلیسی
Concept drift; Data stream mining; Ensemble classifier; Class imbalance;
پیش نمایش مقاله
پیش نمایش مقاله  مجموعه تلفیقی گسسته برای معادن، جریانهای داده ای را با ریزش مفهوم نامناسب مقایسه می کند

چکیده انگلیسی

To overcome these issues, we propose an ensemble classifier called Gradual Resampling Ensemble (GRE). GRE could handle data streams which exhibit concept drifts and class imbalance. On the one hand, a selectively resampling method, where drifting data can be avoidable, is applied to select a part of previous minority examples for amplifying the current minority set. The disjuncts can be discovered by the DBSCAN clustering, and thus the influences of small disjuncts and outliers on the similarity evaluation can be avoidable. Only those minority examples with low probability of overlapping with the current majority set can be selected for resampling the current minority set. On the other hand, previous component classifiers are updated using latest instances. Thus, the ensemble could quickly adapt to a new condition, regardless types of concept drifts. Through the gradual oversampling of previous chunks using the current minority events, the class distribution of past chunks can be balanced. Favorable results in comparison to other algorithms suggest that GRE can maintain good performance on minority class, without sacrificing majority class performance.