ترجمه فارسی عنوان مقاله
APATE: رویکرد نوین برای کشف کلاهبرداری تراکنش کارت اعتباری خودکار با استفاده از الحاقیات مبتنی بر شبکه
عنوان انگلیسی
APATE: A novel approach for automated credit card transaction fraud detection using network-based extensions
کد مقاله | سال انتشار | تعداد صفحات مقاله انگلیسی |
---|---|---|
41647 | 2015 | 11 صفحه PDF |
منبع
Publisher : Elsevier - Science Direct (الزویر - ساینس دایرکت)
Journal : Decision Support Systems, Volume 75, July 2015, Pages 38–48
فهرست مطالب ترجمه فارسی
چکیده
کلیدواژهها
1.مقدمه
شکل1. نمونه بازیچهای شبکه تقلبی کارت اعتباری. وزنها به ترسیم تاخر تراکنش بین تاجر و دارنده کارت اعتباری میپردازند
2.تقلب در تراکنش کارت اعتباری
2.1. زمینه
2.2. فرایند کشف تقلب در کارت اعتباری
2.3. آثار مربوط
شکل 2. فرایند کشف کارت اعتباری
3.روش تحقیق پیشنهادی
3.1.استخراج ویژگی ذاتی
شکل 3. فرایند برآورد مجدد APATE درباره مدلهای کشف با استفاده از پنجره لغزشی
جدول 1.خلاصه ویژگیهای ورودی بر کوتاه (ST)، میان (MT) و بلند (LT) مدت.
جدول 2.تراکنشها به ازاء هر منطقه و درصد کلاهبرداری.
3.2.استخراج ویژگی شبکه
3.2.1. تعریف شبکه
3.2.2. انتشار تقلب شبکهای
3.2.3. استخراج ویژگی
4.نتایج
4.1.نتایج پیشبینی
4.2.اهمیت متغیر و تاثیر متغیر شبکه
جدول 3.مقایسه مدلها.
شکل 4. منحنی ROC برای مدلهای مختلف.
جدول 4.صحت و AUC (مجموعه آزمون) در 1% میزان مثبت کاذب حداکثری.
جدول 5.AUC برای زیرمجموعههای مختلف متغیرها.
شکل 5. منحنی ROC برای زیرمجموعههای متفاوت متغیرها.
5.نتیجهگیری
شکل 6. اهمیت هر متغیر برای جنگل تصادفی ساخته شده با استفاده از تمام متغیرهای موجود.
کلیدواژهها
1.مقدمه
شکل1. نمونه بازیچهای شبکه تقلبی کارت اعتباری. وزنها به ترسیم تاخر تراکنش بین تاجر و دارنده کارت اعتباری میپردازند
2.تقلب در تراکنش کارت اعتباری
2.1. زمینه
2.2. فرایند کشف تقلب در کارت اعتباری
2.3. آثار مربوط
شکل 2. فرایند کشف کارت اعتباری
3.روش تحقیق پیشنهادی
3.1.استخراج ویژگی ذاتی
شکل 3. فرایند برآورد مجدد APATE درباره مدلهای کشف با استفاده از پنجره لغزشی
جدول 1.خلاصه ویژگیهای ورودی بر کوتاه (ST)، میان (MT) و بلند (LT) مدت.
جدول 2.تراکنشها به ازاء هر منطقه و درصد کلاهبرداری.
3.2.استخراج ویژگی شبکه
3.2.1. تعریف شبکه
3.2.2. انتشار تقلب شبکهای
3.2.3. استخراج ویژگی
4.نتایج
4.1.نتایج پیشبینی
4.2.اهمیت متغیر و تاثیر متغیر شبکه
جدول 3.مقایسه مدلها.
شکل 4. منحنی ROC برای مدلهای مختلف.
جدول 4.صحت و AUC (مجموعه آزمون) در 1% میزان مثبت کاذب حداکثری.
جدول 5.AUC برای زیرمجموعههای مختلف متغیرها.
شکل 5. منحنی ROC برای زیرمجموعههای متفاوت متغیرها.
5.نتیجهگیری
شکل 6. اهمیت هر متغیر برای جنگل تصادفی ساخته شده با استفاده از تمام متغیرهای موجود.
ترجمه کلمات کلیدی
کارت اعتباری تقلب در معامله - تجزیه و تحلیل شبکه - گراف دو بخشی - یادگیری نظارت شده
کلمات کلیدی انگلیسی
Credit card transaction fraud; Network analysis; Bipartite graphs; Supervised learning
ترجمه چکیده
در دهه اخیر، سهولت پرداخت آنلاین فرصتهای جدید بسیاری برای بازرگانی الکترونیک ایجاد کرده است و محدودههای جغرافیایی را برای خردهفروشی کاهش داده است. در حالی که بازرگانی الکترونیک هنوز در حال کسب محبوبیت است، زمینبازی متقلبانی نیز هست که تلاش دارند از شفافیت خریدهای آنلاین و انتقال سوابق کارت اعتباری سوء استفاده کنند. این مقاله APATE را پیشنهاد میکند، رویکردی نوین برای کشف تراکنشها تقلبی کارت اعتباری که در فروشگاههای آنلاین انجام شده است. رویکردمان به ترکیب موارد ذیل میپردازد (1) ویژگیهای ذاتی مشتق از مشخصههای تراکنشها ورودی و تاریخچه خرجکرد مشتری با استفاده از اصول RFM (تاخر-تکرار-پولی)؛ و (2) ویژگیهای مبتنی بر شبکه با استفاده از شبکه دارندگان کارت اعتباری و تجار و مشتق گرفتن از امتیاز بدگمانی وابسته به زمان برای هرکدام از موضوعات شبکه. نتایجمان نشان میدهد هردو ویژگی مبتنی بر شبکه و ذاتی دو جنبه کاملاً در هم تنیده از یک تصویر هستند. ترکیبی از این دو نوع ویژگی منجر به بهترین مدلهای اجرایی میشود که به امتیازهای بالاتر از 0.98 برای AUC میرسد.
ترجمه مقدمه
در سالهای اخیر، بازرگانی الکترونیک محبوبیت زیادی به دست آورده است که اصولاً مربوط به سهولت خریدهای فرامرزی و تراکنشهای کارت اعتباری آنلاین بوده است. مشتریان دیگر محدود به پیشنهادات و شرایط خردهفروشان محلی نیستند، بلکه می توانند از بین تعداد زیادی از خردهفروشان در سراسر دنیا انتخاب کنند و قادر به مقایسه محصولاتشان، کیفیت پیشنهادی، قیمت، خدمات و غیره تنها با چند کلیک باشند. در حالی که بازرگانی الکترونیک کسبوکار بالغ همراه با بازیگران متعدد است، امنیت برای پرداخت آنلاین عقب مانده است. اخیراً، بانک مرکزی اروپا (ECB) گزارش کرد که مقدار تقلب کارتی در سال 2012 تا 14.8% در مقایسه با سال قبل افزایش یافته است [21]. دلیل اصلی رشد زیاد در فروش آنلاین است که منتج به تراکنشها فراوان «بدون حضور کارت» (CNP) است، ابزار پرداخت که توجه افراد غیرمجاز را به خود جلب کرده است کسانی که تلاش میکنند نظام را با تظاهر به اینکه کسی دیگر هستند فریب دهند. در نتیجه، صادرکنندههای کارت اعتباری نیازمند نظام خودکار هستند که از تعقیب تراکنش ورودی جلوگیری میکند به شرطی که این تراکنش فوقالعاده نسبت به تقلب حساس باشد، یعنی تراکنش متناظر با رفتار مشتری معمولی نباشد.
این اثر بر کشف خودکار تراکنشها متقلبانه آنلاین تمرکز دارد. دادهکاوی تکنیکهای زیاد برای یافتن الگوها در دادهها پیشنهاد میکند، و تراکنشها معمولی را از مشکوک متمایز میکند. چالش اصلی در تقلب مواجهه مناسب با مشخصههای غیرمعمول تقلب است. یعنی، تراکنشها مشروع فراوان وجود دارد و شواهد تراکنشها متقلبانه برای یادگیری کم است، این موضوع فرایند کشف را پیچیده میکند. تفکر دقیق و ایجاد مشخصات معنیدار که قادر به شناخت رفتار نامعمول باشند، گامی ضروری در فرایند کشف تقلب کارآمد است. در این مقاله، هر دو ویژگی مرتبط با شبکه و ذاتی را ترکیب میکنیم. ویژگیهای ذاتی تراکنش را تجزیه و تحلیل میکنند که آیا نهادی جداگانه هست یا خیر، و مقایسه میکنند که ایا تراکنش با پروفایل مشتری معمولی تناسب دارد یا خیر. این ویژگیها را با مشتق گرفتن از خصوصیات RFM –تاخر، تکرار و ارزش پولی- تراکنشها گذشته دارنده کارت اعتباری ایجاد میکنیم. ویژگیهای مبتنی بر شبکه، از سوی دیگر، هر مبادله را با ایجاد و تحلیل شبکهای متشکل از دارندگان کارت اعتباری و تجاری مشخص میکند که به وسیله تراکنشها به هم مربوط شدهاند. شبکه نمونه در شکل 1 آورده شده است.
از الگوریتم استنباط جمعی برای گسترش تاثیر تقلب از طریق شبکه با استفاده از مجموعه محدود تراکنشها تقلبی تایید شده استفاده میکنیم و در مورد سوء ظن هرکدام از اشیا شبکه با مشتقگیری از امتیاز در معرض قرارگیری تصمیمگیری میکنیم- یعنی میزانی که تراکنش، دارنده حساب مرتبط و تاجر در معرض تاثیرگذاریهای متقلبانه گذشته قرار میگیرند.
در این اثر، به سوالات ذیل پاسخ خواهید داد: (1) آیا تراکنش ورودی جدید با رفتار مشتری معمول همخوان است، یعنی آیا متناظر با الگوهای خرجکرد معمول آن مشتری در قالب (الف) تکرار یا تعداد میانگین تراکنشها در طی پنجره زمانی خاص هست، (ب) تاخر یا زمان میانگین بین تراکنش فعلی و قبلی و (پ) ارزش پولی یا مبلغ پرداختی برای آن تراکنش؟ (2) کدام گروه از تجار، کارتهای اعتباری و تراکنشها به تقلب حساس هستند؟ با توجه به اطلاعات گذشته مبتنی بر شبکه بین تجار و دارندگان کارت اعتباری از طریق تراکنشها، چگونه امتیاز سوءظن را برای گروههای ذیل نتیجهگیری میکنیم (الف) تجار با نمایش این موضوع که کدام تجار اغلب با تقلب در ارتباط هستند، و در نتیجه، ریسک دنبال کردن تراکنشها متقلبانه آتی را شکل میدهند؛ (ب) دارندگان کارت اعتباری که به صورت غیرمعمول عمل میکنند یا کارت اعتباریشان دزدیده شده است و (پ) تراکنشها با ترکیب شواهدی از دارنده کارت اعتباری و تاجر؛ (3) آیا رویکرد کشفمان با ترکیب هردو ویژگی ذاتی و مبتنی بر شبکه، به شکلی معنی دار عملکرد مربوط به مدلهای صرفاً-ذاتی سنتی را تقویت میکند، و اگر اینطور است، کدام مجموعه ویژگیهای خاص به کشف تقلب به شکلی کارآمد کمک میکنند؟
APATE (سرواژه برای: جلوگیری از ناهنجاری با استفاده از شناسایی تراکنش پیشرفته) را پیشنهاد میکنیم، رویکردی نوین، خودکار و بلادرنگ برای بررسی تقلب تراکنش کارت اعتباری با ترسیم الگوهای خرید قبلی و رفتار مشتری در ویژگیهای معنیدار و مقایسه این ویژگیها با مشخصات تراکنش ورودی جدید. تکنیکهای دادهکاوی تحت نظارت را برای آشکار کردن الگوهای تقلب از مجموعه دادههای بلادرنگ تراکنش کارت اعتباری به دست آمده از صادرکننده بزرگ کارت اعتباری در بلژیک اعمال میکنیم. رویکردمان با قاعده شش ثانیه مطابقت دارد، یعنی ظرف شش ثانیه الگوریتم APATE باید تصمیمگیری کند که آیا تراکنش باید تحت تعقیب قرار بگیرد یا خیر. با پیشنهاد الگوریتم توزیع جدید برای گسترش تقلب از حاشیههای شبکه (یعنی تراکنشها) به سمت تمام عناصر شبکه (یعنی دارندگان کارت اعتباری و تجار) و نتیجهگیری برای هر ویژگی مبتنی بر شبکه تراکنش به این موضوع کمک میکنیم. این ویژگیها با مجموعهای از ویژگیهای ذاتی ترکیب میشوند تا الگوریتمهای یادگیری را ایجاد کنند. مدل کشف تقلبمان قادر به انطباق پویا با محیط در حال تغییر است و به فعالیت تحت شرایطی ادامه میدهد که در آن متقلبان روشهای جدید برای ارتکاب فعالیتهای غیرمجازشان ایجاد میکنند.
بقیه مقاله به شرح ذیل سازماندهی شده است. حوزه تقلب کارت اعتباری را در بخش 2 معرفی میکنیم. بخش 3 به روش تحقیق پیشنهادی میپردازد و بر استخراج ویژگی مبتنی بر شبکه و ذاتی تمرکز میکند (بخشهای 3.1 و 3.2). در بخش 4، نتایج را به صورت خلاصه ارائه میکنیم. بخش 5 نتیجهگیری مقاله است.