ترجمه فارسی عنوان مقاله
مروری بر رویکردهای مختلف به حل مسائل دادهکاوی
عنوان انگلیسی
Overview of different approaches to solving problems of Data Mining
کد مقاله | سال انتشار | تعداد صفحات مقاله انگلیسی |
---|---|---|
107851 | 2018 | 6 صفحه PDF |
منبع
Publisher : Elsevier - Science Direct (الزویر - ساینس دایرکت)
Journal : Procedia Computer Science, Volume 123, 2018, Pages 234-239
فهرست مطالب ترجمه فارسی
چکیده
کلمات کلیدی
1-مقدمه
2 وظایف دادهکاوی
شکل ۱ طبقهبندی فضای دوبعدی
1 مراحل دادهکاوی طبقهبندی
2 طبقهبندی روشهای دادهکاوی
3 نتیجهگیری
4 نتیجهگیری
ترجمه چکیده
این نوشتار به وظایف اصلی در تجزیهوتحلیل مقادیر زیادی از اطلاعات و مقایسه روشها برای نتیجهشان اختصاصیافته است. تجزیهوتحلیل حجم بزرگی از اطلاعات و شناسایی دانش ارزشمندی که توسط ابزارهای دادهکاوی ارائهشدهاند. مفهوم دادهکاوی بهعنوان دادهکاوی، تحلیل دادهها، جمعآوری دادهها ترجمهشده است. به دلیل گوناگونی بسیار زیاد انواع دادهها و شیوههای ساماندهی اطلاعات، دادههای واقعی ممکن است همیشه توسط ابزارهای یادگیری ماشینی مورد تجزیهوتحلیل قرار نگیرند. برای دگرگونی دادههای «خام» به دادههایی که شیوههای کارآمد دادهکاوی را ممکن سازد، باید مسئله پیشپردازش را حل کنید. روشهای K-نزدیکترین همسایه و درخت تصمیمگیری چنین مسائلی مانند طبقهبندی دادهکاوی و وایازش در گسترههای مشخصشده را حل میکند.
ترجمه مقدمه
به دلیل گوناگونی گسترده روشهای دادهکاوی و گونههای مختلف اطلاعات و شیوههای ارائه دادهها نیاز است حدود کاربردپذیری و مربوط بودن برخی روشها را برابر دادههای ارائهشده و اهداف بهدستآمده تعریف کنیم. همچنین ضروری است درک کنیم که چگونه باید با بدترین حالت دادهکاوی بهعنوان طبقهبندی، وایازش، خوشهبندی و غیره مسئله را حل نمود. پس از موفقیت نتیجه پردازش دادهها، هر مرحله از انتخاب دادهها و پایان دادن آن با توضیحی از ناهنجاریها در نتایج آشکار میشود. در این نوشتار روشهای خصوصیات k-نزدیکترین همسایه و درخت تصمیمگیری در زمینههای مختلف موضوعی موردبررسی قرار خواهد گرفت.
همانطور که دادهها را برای زمینههای موضوعی مختلف مطالعه میکنیم ویژگیهای دادهها و روشهای کار با آنها بسته به بخش تغییر میکند. دادهکاوی گام مهمی در پیشپردازش دادهها است. فرآیند پیشفراوری بیشتر اوقات زمانبرترین و طولانیترین است. هرازگاهی بخش بزرگی از همه فرایند دادهکاوی را اشغال میکند. افزون بر این منابع و زمان فراوانی صرف گزینش مدل و آموزش آن شده است.