دانلود مقاله ISI انگلیسی شماره 102322
ترجمه فارسی عنوان مقاله

رگرسیون خطی تقریبا کلی با داده های اشتباه طبقه بندی شده و برنامه کاربردی برای انتقال بازار کار

عنوان انگلیسی
Generalized partially linear regression with misclassified data and an application to labour market transitions
کد مقاله سال انتشار تعداد صفحات مقاله انگلیسی
102322 2017 15 صفحه PDF
منبع

Publisher : Elsevier - Science Direct (الزویر - ساینس دایرکت)

Journal : Computational Statistics & Data Analysis, Volume 110, June 2017, Pages 145-159

ترجمه کلمات کلیدی
رگرسیون نیمه پارامتریک، خطای اندازه گیری، اطلاعات جانبی،
کلمات کلیدی انگلیسی
Semiparametric regression; Measurement error; Side information;
ترجمه چکیده
مجموعه داده های بزرگ که از فعالیت های اداری یا عملیاتی منشا می گیرد به طور فزاینده ای برای تحلیل آماری استفاده می شود، زیرا اغلب اطلاعات بسیار دقیق و تعداد زیادی مشاهدات را شامل می شود. اما شواهدی وجود دارد که برخی از متغیرها می توانند به اشتباه طبقه بندی شدید و یا حاوی مقادیر گم شده باشند. با توجه به اندازه داده ها، یک مدل غیرقابل طبقه بندی نیمپارامتری قابل انعطاف، انتخاب خوبی خواهد بود، اما استفاده از آن در عمل کمیاب است. برای بستن این شکاف، یک مدل نیمه پارامتری برای احتمال رعایت تغییرات بازار کار با استفاده از یک نمونه از مشاهدات 20 متر از آلمان تخمین زده می شود. نشان داده شده است که اثرات حاشیه ای تعدادی از متغیرها به طور معنی داری با طبقه بندی نامناسب و مقادیر گمشده در داده های تجزیه و تحلیل مواجه می شوند. پیشنهاد رگرسیون خطی تقریبی به طور کلی، مدل های موجود را گسترش می دهد و اجازه می دهد که یک متغیر گسسته طبقه بندی نشده با یک تابع غیر پارامتری یک متغیر پیوسته تعامل داشته باشد.
پیش نمایش مقاله
پیش نمایش مقاله  رگرسیون خطی تقریبا کلی با داده های اشتباه طبقه بندی شده و برنامه کاربردی برای انتقال بازار کار

چکیده انگلیسی

Large data sets that originate from administrative or operational activity are increasingly used for statistical analysis as they often contain very precise information and a large number of observations. But there is evidence that some variables can be subject to severe misclassification or contain missing values. Given the size of the data, a flexible semiparametric misclassification model would be good choice but their use in practise is scarce. To close this gap a semiparametric model for the probability of observing labour market transitions is estimated using a sample of 20 m observations from Germany. It is shown that estimated marginal effects of a number of covariates are sizeably affected by misclassification and missing values in the analysis data. The proposed generalized partially linear regression extends existing models by allowing a misclassified discrete covariate to be interacted with a nonparametric function of a continuous covariate.