دانلود مقاله ISI انگلیسی شماره 110644
ترجمه فارسی عنوان مقاله

یادگیری فعال برای رگرسیون لجستیک مجاز با استفاده از طراحی تجربی تکراری

عنوان انگلیسی
Active learning for penalized logistic regression via sequential experimental design
کد مقاله سال انتشار تعداد صفحات مقاله انگلیسی
110644 2017 8 صفحه PDF
منبع

Publisher : Elsevier - Science Direct (الزویر - ساینس دایرکت)

Journal : Neurocomputing, Volume 222, 26 January 2017, Pages 183-190

ترجمه کلمات کلیدی
یادگیری فعال، رگرسیون لجستیک، طراحی تجربی،
کلمات کلیدی انگلیسی
Active learning; Logistic regression; Experimental design;
ترجمه چکیده
رگرسیون لجستیک محکوم شده برای طبقه بندی مفید است که نه تنها برآوردهای احتمالی کلاس را ارائه می دهد، بلکه می تواند مشکل بیش از حد را نیز حل کند. به طور سنتی، یادگیری طبقهبندی شده نظارت شده، مقدار زیادی از اطلاعات نشانه گذاری شده را مورد نیاز است. با توجه به نوآوری های فنی، حجم زیادی از داده های بدون برچسب را جمع آوری می کند، در حالی که برچسب گذاری معمولا گران و دشوار است. هدف از یادگیری فعال هدف انتخاب موضوعات موردنظر برای برچسب زدن برای کاهش میزان درخواست های برچسب گذاری است. به تازگی، یادگیری فعال با استفاده از تکنیک های طراحی تجربی توجه زیادی را جلب کرده است. معیارهای معمول تلاش برای کاهش خطای عمومی شدن یک مدل با به حداقل رساندن واریانس برآورد یا تعصب برآورد می شود. با این حال، آنها موفق به در نظر گرفتن هر دو مولفه به طور همزمان. در این مقاله، یک الگوریتم جدید یادگیری فعال با استفاده از رگرسیون لجستیک مجاز ارائه شده است. موضوعات پرکاربرد ترین افراد به عنوان افرادی با کمترین خطای برآورد مربع مربع انتخاب شده اند. این معیار، با ایده طراحی پیوسته، در الگوریتم های ما مورد سوء استفاده قرار گرفته است تا یک روش برای انتخاب موضوع جدید مورد استفاده قرار گیرد. آزمایشات بر روی مجموعه داده های گسترده در دنیای واقعی اثربخشی و کارآیی روش پیشنهادی را در مقایسه با چندین جایگزین فعال در زمینه پیشرفته پیشرفته نشان می دهد.
پیش نمایش مقاله
پیش نمایش مقاله  یادگیری فعال برای رگرسیون لجستیک مجاز با استفاده از طراحی تجربی تکراری

چکیده انگلیسی

Penalized logistic regression is useful for classification that not only provides class probability estimates but also can overcome overfitting problem. Traditionally, supervised classifier learning has required a lot of labeled data. Due to technical innovation, it is easy to collect large amounts of unlabeled data, while labeling is usually expensive and difficult. Active learning aims to select the most informative subjects for labeling to decrease the amount of labeling requests. Recently, active learning using experimental design techniques have attracted considerable attention. The typical criteria attempt to reduce the generalization error of a model by minimizing either its estimation variance or estimation bias. However, they fail to take into account both components simultaneously. In this article, we introduce a new algorithm of active learning using penalized logistic regression. The most informative subjects are selected as those with the smallest mean squared estimation error. This criterion, integrated with the idea of sequential design, is exploited in our algorithms to guide a procedure for a new subject selection. Experiments on extensive real-world data sets demonstrate the effectiveness and efficiency of the proposed method compared to several state-of-the-art active-learning alternatives.