دانلود مقاله ISI انگلیسی شماره 139103
ترجمه فارسی عنوان مقاله

تشخیص طنز اتوموبیل و تشخیص افسانه ای با استفاده از مجموعه ویژگی های مجموعه و داده کاوی

عنوان انگلیسی
A novel automatic satire and irony detection using ensembled feature selection and data mining
کد مقاله سال انتشار تعداد صفحات مقاله انگلیسی
139103 2017 40 صفحه PDF
منبع

Publisher : Elsevier - Science Direct (الزویر - ساینس دایرکت)

Journal : Knowledge-Based Systems, Volume 120, 15 March 2017, Pages 15-33

ترجمه چکیده
تشخیص زبان تصویری همیشه یک کار دشواری برای انسان ها است، در حالی که گزاره ای پیچیده تر است، حتی اگر خودکار با استفاده از متن و داده کاوی. رویکردهای محاسباتی موجود نیز در توانایی و گستردگی آنها بسیار محدود است. در این راستا، ما یک روش انتخاب انتخاب متن متنی را دنبال می کنیم و یک چارچوب جدید در پارادایم متن و داده کاوی به طور خودکار تشخیص طنز، سارکاسم و افسون در اخبار و بررسی مشتری پیدا می شود. اثربخشی رویکرد پیشنهادی بر روی سه مجموعه داده شامل دو مجموعه داده ی ساتریک و یک وحشی نشان داده شد. روش پیشنهادی به خوبی در یک مجموعه داده ساتریک انجام شده و نتایج امیدوار کننده ای در دو مجموعه داده باقی مانده است. علاوه بر این، برخی از ویژگی های جالب مشترک طنز و عجیب و غریب مانند روند عاطفی (احساس منفی)، نگرانی شخصی (اوقات فراغت)، فرایند بیولوژیکی (بدن و جنسی)، ادراک (دیدن)، زبان غیر رسمی (سوگند)، فرایند اجتماعی (مرد )، فرآیند شناختی (خاص)، و روان شناسی (سازگاری و تصویر پذیری)، که از سه جنبه استخراج شده است. از اهمیت ویژه ای برخوردار است که مقایسه رویکرد ما با ارزیابی انوتاتورهای انسانی است که به عنوان پایه ای در این وظایف عمل می کند.
پیش نمایش مقاله
پیش نمایش مقاله  تشخیص طنز اتوموبیل و تشخیص افسانه ای با استفاده از مجموعه ویژگی های مجموعه و داده کاوی

چکیده انگلیسی

Figurative language detection has always been a difficult task for human beings while being a more difficult proposition, even if automated using text and data mining. The available computational approaches are also quite limited in their capabilities and scope. In this regard, we propose an ensembled text feature selection method followed by a new framework in the paradigm of text and data mining to automatically detect satire, sarcasm, and irony found in news and customer reviews. The effectiveness of the proposed approach was demonstrated on three datasets including two satiric and one ironic dataset. The proposed methodology performed well on one satiric dataset and yielded promising results on the remaining two datasets. Moreover, we found out some interesting common characteristics of satire and irony like affective process (negative emotion), personal concern (leisure), biological process (body and sexual), perception (see), informal language (swear), social process (male), cognitive process (certain), and psycholinguistic (concreteness and imageability), which were extracted from three corpora. Of particular significance is the comparison of our approach with human annotators' evaluations, which served as a baseline in these tasks.