دانلود مقاله ISI انگلیسی شماره 137398
ترجمه فارسی عنوان مقاله

کار با متغیرهای زیر گزارش شده: راه حل تئوری اطلاعات

عنوان انگلیسی
Dealing with under-reported variables: An information theoretic solution
کد مقاله سال انتشار تعداد صفحات مقاله انگلیسی
137398 2017 19 صفحه PDF
منبع

Publisher : Elsevier - Science Direct (الزویر - ساینس دایرکت)

Journal : International Journal of Approximate Reasoning, Volume 85, June 2017, Pages 159-177

ترجمه کلمات کلیدی
زیر گزارش دادن، تعصب اشتباه طبقه بندی، داده های گم شده، اطلاعات متقابل،
کلمات کلیدی انگلیسی
Under-reporting; Misclassification bias; Missing data; Mutual information;
ترجمه چکیده
گزارش زیر گزارش شده در داده های نظرسنجی رخ می دهد زمانی که یک دلیل برای شرکت کنندگان برای پاسخ منفی کاذب به یک سوال وجود دارد، برای مثال سیگار کشیدن مادر در مطالعات اپیدمیولوژیک. عدم اصلاح این گزارش نادرست، تعصب را پیش بینی می کند و ممکن است به تصمیم گیری غلط اطلاعات منتهی شود. کار ما روش های اصلاح این تعصب را فراهم می کند، با تفسیر آن به عنوان یک مشکل داده های از دست رفته و به ویژه یادگیری از داده های مثبت و بدون برچسب. تمرکز بر روی رویکردهای نظری اطلاعات سه تعهد کلیدی دارد: (1) ما یک روش برای انجام آزمونهای استقلال معتبر با قدرت شناخته شده را با استفاده از دانش قبلی درباره گزارش نادرست ارائه می دهیم؛ (2) ما برای تصحیح نقطه / فاصله اطلاعات متقابل که ضریب همبستگی و افزونگی را به دست می آوریم، اصلاح می کنیم؛ و در نهایت، (3) راه های مختلفی برای رتبه بندی عوامل زیر گزارش شده است. علاوه بر این، ما نشان می دهیم که چگونه از نتایج ما در مسائل دنیای واقعی و وظایف یادگیری ماشین استفاده کنیم.
پیش نمایش مقاله
پیش نمایش مقاله  کار با متغیرهای زیر گزارش شده: راه حل تئوری اطلاعات

چکیده انگلیسی

Under-reporting occurs in survey data when there is a reason for participants to give a false negative response to a question, e.g. maternal smoking in epidemiological studies. Failing to correct this misreporting introduces biases and it may lead to misinformed decision making. Our work provides methods of correcting for this bias, by reinterpreting it as a missing data problem, and particularly learning from positive and unlabelled data. Focusing on information theoretic approaches we have three key contributions: (1) we provide a method to perform valid independence tests with known power by incorporating prior knowledge over misreporting; (2) we derive corrections for point/interval estimates of the mutual information that capture both relevance and redundancy; and finally, (3) we derive different ways for ranking under-reported risk factors. Furthermore, we show how to use our results in real-world problems and machine learning tasks.