دانلود مقاله ISI انگلیسی شماره 83947
ترجمه فارسی عنوان مقاله

به دست آوردن رژیم های داده-تحلیلی مطلوب از مطالعات تطبیقی

عنوان انگلیسی
Deriving optimal data-analytic regimes from benchmarking studies
کد مقاله سال انتشار تعداد صفحات مقاله انگلیسی
83947 2017 25 صفحه PDF
منبع

Publisher : Elsevier - Science Direct (الزویر - ساینس دایرکت)

Journal : Computational Statistics & Data Analysis, Volume 107, March 2017, Pages 81-91

ترجمه کلمات کلیدی
خوشه بندی افزودنی، معیار سنجش، درختان طبقه بندی مقایسه روش ها، رژیم های داده تحلیلی، نظارت بر یادگیری،
کلمات کلیدی انگلیسی
Additive clustering; Benchmarking; Classification trees; Comparison of methods; Data-analytic regimes; Supervised learning;
ترجمه چکیده
در مطالعات تطبیقی ​​با مجموعه داده های شبیه سازی شده که در آن دو یا چند روش آماری با یکدیگر مقایسه می شوند، علاوه بر جستجوی یک روش جامع برنده، می توانند روش روش برنده شدن را بر اساس الگوهای ویژگی های داده یا مکانیزم تولید داده ها متفاوت کنند. . جالب توجه است، این مشکل، شباهت های متداول رسمی با مشکل به دنبال رژیم های درمان بهینه در آمار زیست شناسی است، زمانی که دو یا چند جایگزین برای یک مشکل یا بیماری یکسان وجود دارد. مشخص شده است که چگونه رژیم های داده های تحلیلی مطلوب، یعنی قواعد برای بهینه سازی فراخوانی در روش های آماری، می توانند از مطالعات سنجش با داده های شبیه سازی شده با استفاده از روش های طبقه بندی تحت نظارت (به عنوان مثال، درختان طبقه بندی)، حاصل شود. این رویکرد با استفاده از تجزیه و تحلیل داده ها از یک مطالعه تطبیقی ​​برای مقایسه دو الگوریتم مختلف برای برآورد مدل خوشه بندی افزایشی دو حالت نشان داده شده است.
پیش نمایش مقاله
پیش نمایش مقاله  به دست آوردن رژیم های داده-تحلیلی مطلوب از مطالعات تطبیقی

چکیده انگلیسی

In benchmarking studies with simulated data sets in which two or more statistical methods are compared, over and above the search of a universally winning method, one may investigate how the winning method may vary over patterns of characteristics of the data or the data-generating mechanism. Interestingly, this problem bears strong formal similarities to the problem of looking for optimal treatment regimes in biostatistics when two or more treatment alternatives are available for the same medical problem or disease. It is outlined how optimal data-analytic regimes, that is to say, rules for optimally calling in statistical methods, can be derived from benchmarking studies with simulated data by means of supervised classification methods (e.g., classification trees). The approach is illustrated by means of analyses of data from a benchmarking study to compare two different algorithms for the estimation of a two-mode additive clustering model.