دانلود مقاله ISI انگلیسی شماره 107947
ترجمه فارسی عنوان مقاله

مدل پیش بینی بیماری دیابت نوع 2 بر اساس داده کاوی

عنوان انگلیسی
Type 2 diabetes mellitus prediction model based on data mining
کد مقاله سال انتشار تعداد صفحات مقاله انگلیسی
107947 2018 12 صفحه PDF
منبع

Publisher : Elsevier - Science Direct (الزویر - ساینس دایرکت)

Journal : Informatics in Medicine Unlocked, Volume 10, 2018, Pages 100-107

فهرست مطالب ترجمه فارسی
چکیده

کلمات کلیدی

1.مقدمه

شکل 1. گرایش درصدی بیماران دیابتی در چین

2.کارهای مرتبط

3.مدل و الگوریتم

شکل2. مدل الگوریتم

3. 1. جعبه ابزار داده کاوی

جدول 1. مقادیر دقت کلاس بندی 

3. 2. توصیف مجموعه داده

3. 3. پیش پردازش داده ها

جدول 2. نمونه هایی از مجموعه داده

3. 4. کلاس بندی داده ها

3. 4. 1. الگوریتم خوشه بندی k-means بهبودیافته 

شکل 3. رویه های الگوریتم k-means

جدول 3. نتیجه خوشه بندی 2-means از مجموعه داده اولیه

3. 4. 2. الگوریتم رگرسیون لجستیک

4. نتایج آزمایشی

شکل 4. نتیجه آزمایش

4. 1. اعتبارسنجی متقابل k-fold

4. 2. دقت جزیی 

جدول 4. ماتریس پریشانی

شکل 5. ناحیهROC

4. 3. آماره Kappa 

5. بحث

5. 1. اعتبارسنجی مدل

جدول 5. مقایسه با آزمایشات دیگر

5. 2. ارزیابی توسط مجموعه داده های جدید

5. 2. 1. مجموعه داده فراهم شده توسط Dr. Schorling

جدول 6. ماتریس پریشانی

جدول 7. نتیجه مجموعه داده جدید

5. 2. 2.مجموعه داده جمع آوری شده از پرسشنامه های آنلاین

جدول 8. ماتریس پراکندگی

جدول9. نتیجه مجموعه داده جدید 

6. نتیجه گیری و کارهای آینده
ترجمه کلمات کلیدی
مدل پیش بینی ترکیبی، داده کاوی، دیابت
کلمات کلیدی انگلیسی
Hybrid prediction model; Data mining; Diabetes mellitus;
ترجمه چکیده
به دلیل رخداد افزایشی بیماری دیابت، خانواده های بیشتری توسط بیماری دیابت تاثیر می پذیرند. اکثر بیماران دیابتی درباره وضعیت سلامتی خود یا فاکتورهای خطرناکی که قبل از تشخیص با آن ها مواجه می شوند، اطلاعات کمی دارند. در این مطالعه، ما یک مدل جدید را براساس تکنیک های داده کاوی برای پیش بینی کردن بیماری دیابت نوع2 (T2DM) پیشنهاد داده ایم. مشکلات اصلی که سعی در حل آن ها داریم عبارتند از بهبود دادن دقت مدل پیش بینی و مدل را برای بیش از یک مجموعه داده، تطابق دهیم. براساس یک مجموعه از رویه های پردازشی، مدل از دو بخش تشکیل می شود، الگوریتم K-means بهبودیافته و الگوریتم رگرسیون لجستیک. مجموعه داده دیابت Pima Indians و محیط Waikato به عنوان جعبه ابزار تحلیل دانش به منظور مقایسه نتایج تحقیق ما با نتایج تحقیقات دیگر استفاده شدند. نتیجه گیری نشان می دهد که مدل 3.04% دقت پیش بینی بالاتر نسبت به تحقیقات دیگر به دست آورد. به علاوه، مدل ما تضمین می کند که کیفیت مجموعه داده به اندازه کافی است. برای ارزیابی بیشتر کارایی مدل ما، ما آن را بر روی دو مجموعه داده دیابت دیگر اعمال کردیم. نتایج هر دو آزمایش، کارایی خوب را نشان می دهند. در نتیجه، مدل نشان می دهد که برای مدیریت واقعی سلامت در بیماری دیابت مفید است.
ترجمه مقدمه
بیماری دیابت (DM) یک بیماری مزمن است که توسط گلوکز بالای خون مشخص می شود. تقریبا نیمی از بیماران دیابتی دارای فاکتورهای موروثی خانوادگی هستند که یکی از مهم ترین ویژگی های دیابت ا ست. نبود پانکراس برای تولید کردن انسولین به اندازه کافی و استفاده ناکارآمد بدن از انسولین، هر دو از دلایل آسیب رسان بیماری دیابت هستند. دو نوع بیماری دیابت وجود دارد. مبحث بیماری زایی بیماری دیابت نوع1 (T1DM) این است که پانکراس، سلول های B را ترشح می کند که از کاهش دادن به موقع سطح گلوکز خون جلوگیری می کند. مقاومت انسولین و ترشح انسولین به صورت ناکارآمد از عوامل بیماری زایی بیماری دیابت نوع 2 هستند (T2DM)، که DM غیروابسته به انسولین نیز نامیده می شود. در طی 30 سال بعد از توسعه چین، با تعداد رو به رشد بیماران دیابتی، مردم متوجه شده اند که این بیماری مزمن به طور عمیقی بر روی زندگی روزانه هر خانواده و هر فردی تاثیر گذاشته است. یک گرایش صعودی در نرخ دیابتی ها در کل جمعیت وجود دارد ونرخ رشد بیماران مرد دیابتی از بیماران زن دیابتی بیشتر است همانطور که در شکل 1 نشان داده شده است. طبق بعضی از آمارهای رسمی ، تعداد بیماران دیابتی در چین حدود 110 میلیون نفر در سال 2017 بود. این یعنی چین، دارای جمعیت دیابتی های بیشتری در جهان است. شکل 1. گرایش درصدی بیماران دیابتی در چین فدراسیون بین المللی دیابت (IDF) آخرین داده ها در مورد DM را در اطلس دیابت (ویرایش هفتم) نشان می دهد ]1[. آن نشان می دهد که در سال 2015 تعداد بیماران دیابتی در سرتاسر جهان حدود 415 میلیون نفر بود. از نظر گرایش رو به رشد جمعیت دیابتی ها، پیش بینی می شود که این تعداد به 642 میلیون یا یک نفر از هر ده بزرگسال برسد. به منظور کاهش دادن شیوع بیماری و کاهش دادن اثر DM، ضروری است که بر روی گروهی از مردم با ریسک بالای دیابت تمرکز شود. مطابق با آخرین استاندارد سازمان سلامت جهانی (WHO)، تعاریف گروه هایی با ریسک بالای DM به صورت زیر هستند: • سن 45 و خیلی کم ورزش کردن • BMI 24 Kg/m2 • عدم تحمل گلوکز (IGT) یا عدم گلوکز ناشتا (IFG) • تاریخچه خانوادگی DM • کاهش یافتن کلسترول لیپوپروتئین با چگالی بالا یا بالا بودن تری گلیسرید (HTG) • فشار خون بالا یا بیماری قلبی عروقی و مغزی عروقی • زن حامله ای که دارای سن 30 است. به منظور بررسی گروه دارای ریسک بالای DM، ما نیاز به استفاده از فناوری اطلاعات پیشرفته داریم. بنابراین، فناوری داده کاوی یک فیلد مطالعاتی مناسب برای ما است. داده کاوی، همچنین به عنوان کشف دانش در پایگاه داده ها (KDD) نیز شناخته می شود، به عنوان فرآیند محاسباتی کشف کردن الگوها در مجموعه داده های بزرگ تعریف می شود و شامل متدهایی در اشتراک با هوش مصنوعی، یادگیری ماشین، آمار و سیستم های پایگاه داده است ]2[. اهداف اصلی این متدها عبارتند از تشخیص الگو، پیش بینی، انجمنی و خوشه بندی. داده کاوی شامل یک مجموعه از مراحل است که به طور اتوماتیک یا نیمه-اتوماتیک به منظور استخراج کردن و کشف کردن ویژگی های جالب، نامعلوم و پنهان از مقادیر بزرگ داده ها انجام می شوند. کیفیت بالای داده ها و اعمال صحیح متد، دو جنبه برجسته از داده کاوی هستند. داده کاوی به طور موفقیت آمیزی برای حوزه های مختلف در جامعه انسانی اعمال شده است همچون پیش بینی آب و هوا، تحلیل بازار، تشخیص مهندسی و مدیریت ارتباط مشتری. به هرحال، کاربرد در پیش بینی بیماری و تحلیل داده های پزشکی هنوز جا برای بهبود دارد. برای مثال، هر بیمارستانی ، اطلاعات اولیه بیمار و اطلاعات پزشکی زیادی دارد که بازبینی، تکمیل کردن و استخراج دانش بامعنی از این داده ها برای پشتیبانی نمودن تحلیل و تشخیص کلینیکی اساسی است ]3-4[. این باور منطقی است که الگوهای با ارزش متعددی وجود دارند و منتظر هستند تا محققین آن ها را کشف کنند. همانطور که همه ما می دانیم تعداد افراد دیابتی زیاد است و به طور پیوسته در حال افزایش است. علاوه بر این، اکثر مردم درباره وضعیت سلامتی شان اطلاع کمی دارند. بنابراین، این باور ضروری است که یک مدل ایجاد شود که بتواند بیماران را در دسته هایی کلاس بندی کند که آیا بیمارانِ مشکوک هستند یا بیمارانی هستند که از اولین آزمایش آن ها برای گروه DM با ریسک بالا، 5 سال گذشته است. به طور ویژه ما بر روی T2DM تمرکز کرده ایم. قسمت 2، کارهای مرتبط با داده کاوی در گروهی از بیماران دیابتی و بیماران مشکوک را نشان می دهد. قسمت 3، ابزارهای آزمایشی، مجموعه داده و مدل پیش بینی را توضیح می دهد. قسمت 4، نتایج آزمایشی را بیان می کند. قسمت 5، نتایج و رویه های اعتبارسنجی را بیان می کند. قسمت 6، مقاله را با بعضی از جهت ها برای کارهای آینده، خلاصه می کند.
پیش نمایش مقاله
پیش نمایش مقاله  مدل پیش بینی بیماری دیابت نوع 2 بر اساس داده کاوی

چکیده انگلیسی

Due to its continuously increasing occurrence, more and more families are influenced by diabetes mellitus. Most diabetics know little about their health quality or the risk factors they face prior to diagnosis. In this study, we have proposed a novel model based on data mining techniques for predicting type 2 diabetes mellitus (T2DM). The main problems that we are trying to solve are to improve the accuracy of the prediction model, and to make the model adaptive to more than one dataset. Based on a series of preprocessing procedures, the model is comprised of two parts, the improved K-means algorithm and the logistic regression algorithm. The Pima Indians Diabetes Dataset and the Waikato Environment for Knowledge Analysis toolkit were utilized to compare our results with the results from other researchers. The conclusion shows that the model attained a 3.04% higher accuracy of prediction than those of other researchers. Moreover, our model ensures that the dataset quality is sufficient. To further evaluate the performance of our model, we applied it to two other diabetes datasets. Both experiments' results show good performance. As a result, the model is shown to be useful for the realistic health management of diabetes.