ترجمه فارسی عنوان مقاله
توسعۀ رویکردی برای ارزیابی بورس توسط پیش بینی ویژگی های موثر با روش های داده کاوی
عنوان انگلیسی
Developing an approach to evaluate stocks by forecasting effective features with data mining methods
کد مقاله | سال انتشار | تعداد صفحات مقاله انگلیسی |
---|---|---|
45996 | 2015 | 15 صفحه PDF |
منبع
Publisher : Elsevier - Science Direct (الزویر - ساینس دایرکت)
Journal : Expert Systems with Applications, Volume 42, Issue 3, 15 February 2015, Pages 1325–1339
فهرست مطالب ترجمه فارسی
چکیده
کلمات کلیدی
1. مقدمه
2. مدل پیشنهادی
2.1 اولین مرحله : توسعه پایگاه داده های مالی
2.1.1 ویژگی های ورودی
2.1.2 متغیر های پاسخ
2.1.3 پیش پردازش داده ها
شکل 1: طرح مفهومی مدل پیشنهادی
جدول 1 ویژگی های ورودی مالی
جدول 2 مدل های قیمت گذاری بورس
2.2 مرحله دوم: پیش بینی ریسک و بازده با روش های دسته بندی
2.2.1 آزمون استراتژی
شکل 2 انتخاب ویژگی هیبریدی
جدول 3 ماتریس آشفتگی (برهم ریختگی) برای پنج طبقه
2.3 مرحله سوم : انتخاب ویژگی هیبریدی
2.3.1 روش های فیلتر کردن
2.3.2 روش خوشه بندی بر پایه عملکرد
شکل 3 فرآیند نتایج آزمایشگاهی
3. نتایج آزمایشگاهی و تحلیل
3.1 پیش پردازش داده ها
جدول 4 همبستگی میان بازده واقعی و دیگر ویژگی ها
جدول 5 همبستگی میان ریسک و دیگر ویژگی ها
جدول 6 مقایسه الگوریتم ها برای متغیر بازده واقعی
شکل 4: پیش بینی بازده واقعی – درخت تصمیم کارت
3.2 مقایسه الگوریتم ها
3.3 پیش بینی بعد از انتخاب ویژگی هیبریدی
شکل 5 پیش بینی بازده واقعی - درخت LAD
شکل 6: اولین و بهترین درخت تصمیم
شکل 7: پیش بینی بازده واقعی درخت Rep
جدول 7: مقایسه الگوریتم برای متغیر ریسک
شکل 8: پیش بینی ریسک – درخت LAD
جدول 8: وزن دهی برای پارامتر ریسک
جدول 9: وزن دهی برای پارامتر بازده واقعی
جدول 10: ویژگی های انتخاب شده برای پارامترهای بازده و واقعی
4. بحث
4.1 نتایج بازده واقعی در پیش بینی با ویژگی های انتخاب شده
4.2: نتایج ریسک در پیش بینی با ویژگی های انتخابی
جدول 12 مقایسه نتایج با دیگر مطالعات
5. نتیجه گیری
ترجمه کلمات کلیدی
بازار بورس - داده کاوی - الگوریتم طبقه بندی - انتخاب ویژگی - روش خوشه بندی مبتنی بر عملکرد
کلمات کلیدی انگلیسی
Stock market; Data mining; Classification algorithm; Feature selection; Function-based clustering method
ترجمه چکیده
در این پژوهش رویکرد جدیدی برای پیش بینی ریسک ها و بازده بورس توسعه داده شده است. در این رویکرد سه مرحله ای، از طریق بررسی مفهومی همه ویژگی های ممکن که می توانند روی ریسک و بازده بورس اثر بگذارند، شناسایی شده اند. سپس در مرحله بعدی، بازده و ریسک توسط اعمال شیوه های داده کاوی برای ویژگی های مفروض پیش بینی می شود. سرانجام ما یک الگوریتم هیبریدی را بر مبنای خوشه بندی عملکردی و فیلتری توسعه می دهیم: ویژگی های مهم در پیش بینی ریسک و بازده انتخاب شده و سپس بازپیش بینی می شوند. نتایج نشان داد که مدل هیبریدی پیشنهادی، ابزار مناسبی برای انتخاب ویژگی موثر بوده و این ویژگی ها نیز شاخص های خوبی برای پیش بینی بازده و ریسک می باشند. ما برای نشان دادن این رویکرد، علاوه بر آموزش و آزمون داده ها، آن را برای بازار بورس تهران TSE از 2002 تا 2011 بکار بردیم.
ترجمه مقدمه
اطلاعات آینده شرکت ها که بورس ارائه می نماید از اهمیت زیادی برخوردار است. پیش بینی منطقی شاخص مالی شرکت، موقعیتی را برای سرمایه گذار جهت سرمایه گذاری کارآمد تر و بدست آوردن سود بیشتر ایجاد می نماید. این مورد می تواند به مطالعات مختلفی ارجاع داده شود. برای مثال مدل پیش بینی قیمت بورس سری زمانی، مدل پیش بینی خرید –نگهداری –فروش ، مدل پیش بینی شاخص با Anfis یا MAsr و SVR، بدست آوردن سود و غیره. به هر حال برخلاف بازده، ریسک به ندرت برای پیش بینی مورد توجه قرار گرفته، در حالیکه مشتریان معمولا بازده خود را برای سطح مناسبی از ریسک، متعادل و بالانس نموده، بنابراین می توان گفت که ریسک و بازده، عوامل مهمی در تصمیم گیری های مالی می باشند. بدون ارزیابی ریسک، سرحد (مرز) کارآمد پورتفولیو قابل تشخیص نیست. از اینرو این مقاله پیش بینی هایی از ریسک و بازده سهام را انجام می دهد که اثر زیادی روی تنظیم قیمت دارند. همچنین پیش بینی بالا به پایین حرکت بورس نمی تواند منجر به دید دقیقی از آینده بورس و درآمدهای سرمایه گذار باشد. در حالیکه طبقه بندی مقداری از ریسک و بازده برای دسته های مختلف مانند شیوه ها دانش واضح تری را بدست می دهد.
بنابراین در این مطالعه پیش بینی همزمان ریسک و بازده با الگوریتم های دسته بندی مختلف بررسی می شود.
برای پیش بینی دقیق متغیر های ریسک و بازده، عوامل موثر باید شناسایی شوند در واقع یکی از موضوعات کلیدی طراحی پیش بینی بازار این می باشد که ویژگی های نماینده چگونه برای پیش بینی انتخاب شوند.
بیشتر مطالعات در این حوزه بر روی ویژگی های فنی، نسبت های مالی یا شاخص های اقتصاد کلان تمرکز دارند. برای مثال Hsiao 8 نسبت مالی و 16 شاخص اقتصاد کلان را به عنوان ویژگی های اصلی برای پیش بینی بازده بورس توسط توزیع در بازار بورس تایوان بررسی نمود. Cheng نیز مطالعه کاملی بر روی اقتصاد کلان و ویژگی های فنی و 8 نسبت مالی و 10 شاخص اقتصاد کلان برای بررسی تأثیر آنها بر روی تغییرات بازدهی در بورس تایوان را اجرا نمود. توسط اعمال الگوریتم ترویج بازدهی احتمالی، آنها دقت 76 درصدی را بدست آوردند. Nobre از 15 شاخص فنی و 11 شاخص اساسی برای پیش بینی حرکت بورس ها در Petrobras با شبکه های عصبی مصنوعی استفاده کرد و پیش بینی مستقیم 87.5% بدست آورد. Tsai 19 نسبت مالی و 11 شاخص اقتصاد کلان را در بورس تایوان توسط ترکیب الگوریتم رگرسیون لجستیک ، توزیع بازدهی MLP و درخت CART برای بررسی اثر اجرای آنها بر روی بورس در نظر گرفت و دقت 66 درصدی بر مبنای الگوریتم ها را بدست آورد. در اکثر مطالعات، تمرکز روی نسبت مالی، شاخص های اقتصاد کلان و شاخص های فنی بر مبنای ایده های کارشناسان برای پیش بینی بازده ها می باشد. این مقاله نیز یک روش سیستماتیک و کارآمد را برای بررسی تفهیمی ویژگی های نماینده پتانسیل روی بازار بورس در 3 دسته نسبت مالی، سود و گزارشات زیان و مدل های قیمت گذاری بورس و نه انتخاب دلخواه ویژگی های موثر ارائه می نماید.
به علاوه بسیاری از مطالعات ادعا نمودند و تایید نمودند که انتخاب ویژگی، فرایند کلیدی در مدلسازی پیش بینی بورس می باشد. Hu از انتخاب ویژگی تصادفی CFS برای یافتن ویژگی های موثر در بورس شانگهای استفاده کرد. ایده در مدل آنها در مورد تصادفی بودن الگوریتم انتخاب ویژگی می باشد. آنها تعیین نمودند که CFS تاثیرات مستقیمی را میان ویژگی های بورس مختلف نشان می دهد در حالیکه الگوریتم های بر پایه همبستگی نمی توانند تاثیرات مستقیم را از موارد غیر مستقیم تشخیص و تمییز دهند. Wu از ویژگی های فنی و متنی برای بهبود دقت پیش بینی بازار بورس استفاده می نماید. آنها از الگوریتم SVR و روش بخش بندی برای پیش بینی روندها و تولید سیگنال های داد و ستد استفاده می نمایند. الگوریتم انتخاب ویژگی آنها تحلیل رگرسیون مرحله ای می باشد.
در این مطالعه یک الگوریتم انتخاب ویژگی هیبریدی جدید بر پایه روش خوشه بندی بر اساس عملکرد برای انتخاب ویژگی های مهم اعمال می شود. آنچه که شیوه پیشنهادی ما را از موارد قبلی متمایز می سازد این است که ما ترکیبی از 9 الگوریتم انتخاب ویژگی مختلف را با الگوریتم خوشه بندی بر پایه عملکرد در نظر می گیریم. مدل هیبریدی مقاله ما از توان و مزیت الگوریتم های بر پایه همبستگی مانند مربع کای دو Chi، یک-R علاوه بر توان الگوریتم های بر پایه اطلاعات و بر پایه فاصله و خطا های طبقه بندی شده مانند SVM و شاخص جینی، بهره می برد. اثربخشی مدل ما با پیش بینی ریسک و بازده بورس و تحلیل نتایج با و بدون پیاده سازی الگوریتم های انتخاب ویژگی دوگانه ما نشان داده می شود.
مجموعا، در اولین مرحله از مقاله، لیست کاملی از ویژگی های موثر بر روی ریسک ها و بازده بورس شناسایی می شود. بعد از توسعه یک پایگاه داده مناسب در مرحله دوم، الگوریتم های دسته بندی مختلف برای پیش بینی ریسک و بازده استفاده می شود. ما همچنین اثر نتایجمان را بر روی داده هایمان بر مبنای دید بر پایه ویژگی بررسی می نماییم و سرانجام در سومین مرحله، یک الگوریتم انتخاب ویژگی هیبریدی جدید بر مبنای روش خوشه بندی و بر پایه عملکرد و فیلتر برای انتخاب ویژگی های مهم اعمال می شود که بر روی پیش بینی ریسک و بازده اثرگذار است.
کمک این مقاله به صورت زیر خلاصه می شود:
یک مطالعه سیستماتیک و مفهومی برای شناسایی ویژگی های موثر در پیش بینی بازده و ریسک.
ریسک های بورس علاوه بر پیش بینی بازده با روش های دسته بندی مختلف.
طراحی الگوریتم انتخاب ویژگی هیبریدی بر پایه خوشه بندی بر پایه عملکرد و فیلتر.
سرانجام هر الگوریتم با یک دید در جهت ویژگی، تجزیه و تحلیل می شود. نتایج نیز عواملی که باعث قوت و تضعیف آن الگوریتم می شود را نشان می دهد. نتیجتا ماهیت هر ویژگی طبق مقدار متغیر مداخله گر در آن پیش بینی ارائه می گردد.
اطلاعات آینده شرکت ها که بورس ارائه می نماید از اهمیت زیادی برخوردار است. پیش بینی منطقی شاخص مالی شرکت، موقعیتی را برای سرمایه گذار جهت سرمایه گذاری کارآمد تر و بدست آوردن سود بیشتر ایجاد می نماید. این مورد می تواند به مطالعات مختلفی ارجاع داده شود. برای مثال مدل پیش بینی قیمت بورس سری زمانی، مدل پیش بینی خرید –نگهداری –فروش ، مدل پیش بینی شاخص با Anfis یا MAsr و SVR، بدست آوردن سود و غیره. به هر حال برخلاف بازده، ریسک به ندرت برای پیش بینی مورد توجه قرار گرفته، در حالیکه مشتریان معمولا بازده خود را برای سطح مناسبی از ریسک، متعادل و بالانس نموده، بنابراین می توان گفت که ریسک و بازده، عوامل مهمی در تصمیم گیری های مالی می باشند. بدون ارزیابی ریسک، سرحد (مرز) کارآمد پورتفولیو قابل تشخیص نیست. از اینرو این مقاله پیش بینی هایی از ریسک و بازده سهام را انجام می دهد که اثر زیادی روی تنظیم قیمت دارند. همچنین پیش بینی بالا به پایین حرکت بورس نمی تواند منجر به دید دقیقی از آینده بورس و درآمدهای سرمایه گذار باشد. در حالیکه طبقه بندی مقداری از ریسک و بازده برای دسته های مختلف مانند شیوه ها دانش واضح تری را بدست می دهد.
بنابراین در این مطالعه پیش بینی همزمان ریسک و بازده با الگوریتم های دسته بندی مختلف بررسی می شود.
برای پیش بینی دقیق متغیر های ریسک و بازده، عوامل موثر باید شناسایی شوند در واقع یکی از موضوعات کلیدی طراحی پیش بینی بازار این می باشد که ویژگی های نماینده چگونه برای پیش بینی انتخاب شوند.
بیشتر مطالعات در این حوزه بر روی ویژگی های فنی، نسبت های مالی یا شاخص های اقتصاد کلان تمرکز دارند. برای مثال Hsiao 8 نسبت مالی و 16 شاخص اقتصاد کلان را به عنوان ویژگی های اصلی برای پیش بینی بازده بورس توسط توزیع در بازار بورس تایوان بررسی نمود. Cheng نیز مطالعه کاملی بر روی اقتصاد کلان و ویژگی های فنی و 8 نسبت مالی و 10 شاخص اقتصاد کلان برای بررسی تأثیر آنها بر روی تغییرات بازدهی در بورس تایوان را اجرا نمود. توسط اعمال الگوریتم ترویج بازدهی احتمالی، آنها دقت 76 درصدی را بدست آوردند. Nobre از 15 شاخص فنی و 11 شاخص اساسی برای پیش بینی حرکت بورس ها در Petrobras با شبکه های عصبی مصنوعی استفاده کرد و پیش بینی مستقیم 87.5% بدست آورد. Tsai 19 نسبت مالی و 11 شاخص اقتصاد کلان را در بورس تایوان توسط ترکیب الگوریتم رگرسیون لجستیک ، توزیع بازدهی MLP و درخت CART برای بررسی اثر اجرای آنها بر روی بورس در نظر گرفت و دقت 66 درصدی بر مبنای الگوریتم ها را بدست آورد. در اکثر مطالعات، تمرکز روی نسبت مالی، شاخص های اقتصاد کلان و شاخص های فنی بر مبنای ایده های کارشناسان برای پیش بینی بازده ها می باشد. این مقاله نیز یک روش سیستماتیک و کارآمد را برای بررسی تفهیمی ویژگی های نماینده پتانسیل روی بازار بورس در 3 دسته نسبت مالی، سود و گزارشات زیان و مدل های قیمت گذاری بورس و نه انتخاب دلخواه ویژگی های موثر ارائه می نماید.
به علاوه بسیاری از مطالعات ادعا نمودند و تایید نمودند که انتخاب ویژگی، فرایند کلیدی در مدلسازی پیش بینی بورس می باشد. Hu از انتخاب ویژگی تصادفی CFS برای یافتن ویژگی های موثر در بورس شانگهای استفاده کرد. ایده در مدل آنها در مورد تصادفی بودن الگوریتم انتخاب ویژگی می باشد. آنها تعیین نمودند که CFS تاثیرات مستقیمی را میان ویژگی های بورس مختلف نشان می دهد در حالیکه الگوریتم های بر پایه همبستگی نمی توانند تاثیرات مستقیم را از موارد غیر مستقیم تشخیص و تمییز دهند. Wu از ویژگی های فنی و متنی برای بهبود دقت پیش بینی بازار بورس استفاده می نماید. آنها از الگوریتم SVR و روش بخش بندی برای پیش بینی روندها و تولید سیگنال های داد و ستد استفاده می نمایند. الگوریتم انتخاب ویژگی آنها تحلیل رگرسیون مرحله ای می باشد.
در این مطالعه یک الگوریتم انتخاب ویژگی هیبریدی جدید بر پایه روش خوشه بندی بر اساس عملکرد برای انتخاب ویژگی های مهم اعمال می شود. آنچه که شیوه پیشنهادی ما را از موارد قبلی متمایز می سازد این است که ما ترکیبی از 9 الگوریتم انتخاب ویژگی مختلف را با الگوریتم خوشه بندی بر پایه عملکرد در نظر می گیریم. مدل هیبریدی مقاله ما از توان و مزیت الگوریتم های بر پایه همبستگی مانند مربع کای دو Chi، یک-R علاوه بر توان الگوریتم های بر پایه اطلاعات و بر پایه فاصله و خطا های طبقه بندی شده مانند SVM و شاخص جینی، بهره می برد. اثربخشی مدل ما با پیش بینی ریسک و بازده بورس و تحلیل نتایج با و بدون پیاده سازی الگوریتم های انتخاب ویژگی دوگانه ما نشان داده می شود.
مجموعا، در اولین مرحله از مقاله، لیست کاملی از ویژگی های موثر بر روی ریسک ها و بازده بورس شناسایی می شود. بعد از توسعه یک پایگاه داده مناسب در مرحله دوم، الگوریتم های دسته بندی مختلف برای پیش بینی ریسک و بازده استفاده می شود. ما همچنین اثر نتایجمان را بر روی داده هایمان بر مبنای دید بر پایه ویژگی بررسی می نماییم و سرانجام در سومین مرحله، یک الگوریتم انتخاب ویژگی هیبریدی جدید بر مبنای روش خوشه بندی و بر پایه عملکرد و فیلتر برای انتخاب ویژگی های مهم اعمال می شود که بر روی پیش بینی ریسک و بازده اثرگذار است.
کمک این مقاله به صورت زیر خلاصه می شود:
یک مطالعه سیستماتیک و مفهومی برای شناسایی ویژگی های موثر در پیش بینی بازده و ریسک.
ریسک های بورس علاوه بر پیش بینی بازده با روش های دسته بندی مختلف.
طراحی الگوریتم انتخاب ویژگی هیبریدی بر پایه خوشه بندی بر پایه عملکرد و فیلتر.
سرانجام هر الگوریتم با یک دید در جهت ویژگی، تجزیه و تحلیل می شود. نتایج نیز عواملی که باعث قوت و تضعیف آن الگوریتم می شود را نشان می دهد. نتیجتا ماهیت هر ویژگی طبق مقدار متغیر مداخله گر در آن پیش بینی ارائه می گردد.