دانلود مقاله ISI انگلیسی شماره 45034
ترجمه فارسی عنوان مقاله

پیش بینی شاخص بازار سهام با استفاده از تلفیق تکنیک های یادگیری ماشین

عنوان انگلیسی
Predicting stock market index using fusion of machine learning techniques
کد مقاله سال انتشار تعداد صفحات مقاله انگلیسی
45034 2015 11 صفحه PDF
منبع

Publisher : Elsevier - Science Direct (الزویر - ساینس دایرکت)

Journal : Expert Systems with Applications, Volume 42, Issue 4, March 2015, Pages 2162–2172

فهرست مطالب ترجمه فارسی
چکیده

کلمات کلیدی

1.مقدمه

2- روش تک مرحله ای

2-1 شبکه های عصبی مصنوعی

2-2 رگرسیون بردار پشتیبان

شکل 1: معماری عمومی یک روش تک مرحله ای برای پیش بینی n روز پیش از مدت معین.

جدول 1: شاخص های فنی انتخاب شده وفرمول های آن ها (کارا و همکاران، 2011)

جدول 2: پارامترهای شبکه عصبی مصنوعی (ANN) و مقادیر تست شده آن ها

جدول 3: پارامترهای رگرسيون های بردار پشتیبانی (SVR) و مقادیر تست شده آن ها

شکل 2: مدل شبکه عصبی مصنوعی (ANN)

2-3 جنگل تصادفی

شکل3: معماری عمومی یک روش ترکیبی دو مرحله ای برای پیش بینی n روز پیش از مدت معین.

3- روش ترکیبی دو مرحله ای

شکل 4: جزئیات روش ترکیبی دو مرحله ای برای پیش بینی n روز پیش از مدت معین.

4- نتایج تجربی

4-1 داده های آزمایش

4-2 معیارهای ارزیابی

4-3 نتایج

جدول 4: بهترین ترکیب پارامتر گزارش شده از آزمایشات تنظیم پارامتر برای هر یک از رگرسيون های بردار پشتیبانی (SVR) در مرحله اول روش ترکیبی دو مرحله ای

جدول 5: پیش بینی عملکرد یک روز پیش از مدت معین (برای CNX NIFTY).

جدول 6: پیش بینی عملکرد 2 روز پیش از مدت معین (برای CNX NIFTY).

جدول 7: پیش بینی عملکرد 3 روز پیش از مدت معین (برای CNX NIFTY).

جدول 8: پیش بینی عملکرد 4 روز پیش از مدت معین (برای CNX NIFTY).

جدول 9: پیش بینی عملکرد 5 روز پیش از مدت معین (برای CNX NIFTY).

جدول 10: پیش بینی عملکرد 6 روز پیش از مدت معین (برای CNX NIFTY).

جدول 11: پیش بینی عملکرد 7 روز پیش از مدت معین (برای CNX NIFTY).

جدول 12: پیش بینی عملکرد 8 روز پیش از مدت معین (برای CNX NIFTY).

جدول 13: پیش بینی عملکرد 9 روز پیش از مدت معین (برای CNX NIFTY).

جدول 14: پیش بینی عملکرد 10 روز پیش از مدت معین (برای CNX NIFTY).

جدول 15: پیش بینی عملکرد 15 روز پیش از مدت معین (برای CNX NIFTY).

جدول 16: پیش بینی عملکرد 30 روز پیش از مدت معین (برای CNX NIFTY).

جدول 17: پیش بینی عملکرد یک روز پیش از مدت معین (برای S&P BSE).

جدول 18: پیش بینی عملکرد 2 روز پیش از مدت معین (برای S&P BSE).

جدول 19: پیش بینی عملکرد 3 روز پیش از مدت معین (برای S&P BSE).

جدول 20: پیش بینی عملکرد 4 روز پیش از مدت معین (برای S&P BSE).

جدول 21: پیش بینی عملکرد 5 روز پیش از مدت معین (برای S&P BSE).

جدول 22: پیش بینی عملکرد 6 روز پیش از مدت معین (برای S&P BSE).

جدول 23: پیش بینی عملکرد 7 روز پیش از مدت معین (برای S&P BSE).

جدول 24: پیش بینی عملکرد 8 روز پیش از مدت معین (برای S&P BSE).

جدول 25: پیش بینی عملکرد 9 روز پیش از مدت معین (برای S&P BSE).

جدول 26: پیش بینی عملکرد 10 روز پیش از مدت معین (برای S&P BSE).

جدول 27: پیش بینی عملکرد 15 روز پیش از مدت معین (برای S&P BSE).

جدول 28: پیش بینی عملکرد 30 روز پیش از مدت معین (برای S&P BSE).

جدول 29: میانگین عملکرد پیش بینی برای بورس اوراق بهادار ملی هند (CNX Nifty)  

جدول 30: بهبود عملکرد (مدل های پیش بینی دو مرحله ای نسبت به تک مرحله ای) برای CNX Nifty 

جدول 31: میانگین عملکرد پیش بینی برای بورس اوراق بهادار بمبئی (S&P BSE)   

جدول 32: بهبود عملکرد (مدل های پیش بینی دو مرحله ای نسبت به تک مرحله ای) برای S&P BSE

شکل 5: مقایسه پیش بینی عملکرد ANN و SVR-ANN برای پیش بینی 5 روز پیش از زمان برای بورس اوراق بهادار ملی هند (CNX Nifty).

5- نتایج
ترجمه کلمات کلیدی
شبکه های عصبی مصنوعی - رگرسیون بردار پشتیبان - جنگل های تصادفی - بازار بورس - مدل های هیبریدی
کلمات کلیدی انگلیسی
Artificial Neural Networks; Support Vector Regression; Random Forest; Stock market; Hybrid models
ترجمه چکیده
در این مقاله به بحث در خصوص پیش بینی مقادیر آینده شاخص سهام پرداخته شده است. برای ارزیابی تجربی از دو شاخص بورس اوراق بهادار ملی هند (CNX Nifty) و بورس اوراق بهادار بمبئی(S&P BSE) از بازارهای سهام هند استفاده گردیده است. آزمایش ها براساس تاریخچه اطلاعات 10 ساله این دو شاخص انجام شده است. پیش بینی ها بر اساس 1 تا 10، 15 و 30 روز پیش از مدت معین انجام شده است. در این مقاله روش دو مرحله ای ترکیبی پیشنهاد گردیده که در مرحله اول آن از رگرسیون بردار پشتیبانی (SVR) استفاده شده است. در دومین مرحله روش ترکیبی، از شبکه های عصبی مصنوعی (ANN)، جنگل تصادفی (RF) و نتایج رگرسیون بردار پشتیبانی (SVR) در مدل های پیش بینی SVR-ANN، SVR-RF و SVR-SVR استفاده شده است. عملکرد پیش بینی این مدل های ترکیبی با سناریوهای تک مرحله ای ANN، RF و SVR مقایسه گردیده است. برای هر یک از مدل های پیش بینی، 10 شاخص فنی به عنوان ورودی انتخاب شده است.
ترجمه مقدمه
پیش بینی قیمت سهام یک مشکل کلاسیک است. طبق فرضیه بازار کارآمد، پیش بینی قیمت های سهام امکان-پذیر نیست و سهام به شیوه تصادفی رفتار می کند. اما تحلیلگران فنی معتقدند که بیشتر اطلاعات مربوط به سهام در قیمت های اخیر منعکس شده است و بنابراین اگر روند حرکت قیمت ها بررسی شود، قیمت ها به راحتی قابل پیش بینی می باشند. علاوه بر این، حرکات بازار سهام تحت تاثیر عوامل اقتصاد کلان متعددی همچون حوادث سیاسی، سیاست شرکت ها، شرایط اقتصادی عمومی، شاخص قیمت کالاها، نرخ بانکی، نرخ ارز بانکی، انتظارات سرمایه گذاران، انتخاب سرمایه گذاران نهادی، روند حرکتی سایر بازارهای سهام، روانشناسی سرمایه گذاران و غیره دارد (مایائو ، چن و ژائو ، 2007). ارزش شاخص های سهام بر اساس برآورد ارزش حال سرمایه بازار بالا محاسبه می شود. برای دستیابی به اطلاعات آماری از ارزش قیمت سهام، پارامترهای فنی متعددی مورد استفاده قرار گرفته است. شاخص های سهام از برآورد ارزش حال سرمایه بازار بالا استخراج شده اند و به این ترتیب یک نمای کلی از اقتصاد را نشان می دهند و به عوامل متعددی بستگی دارند. روش های متعدد متفاوتی برای مدل سازی سری زمانی وجود دارد. مدل های آماری سنتی شامل میانگین متحرک، یکنواخت سازی نهائی و میانگین متحرک خودهمبسته یکپارچه (ARIMA) در پیش بینی مقادیر آینده خطی هستند (بلرسلف ، 1986؛ شیه ، 1991؛ رائو و گابر، 1984). تحقیقات گسترده ای بر روی برنامه-های پیش بینی متعدد با استفاده از شبکه های عصبی مصنوعی (ANN)، منطق فازی، الگوریتم های ژنتیک (GA) و سایر روش ها انجام شده است (هادوندی، شاوندی و قنبری، 2010؛ لی و تانگ، 2011؛ زرندی، هادوندی و ترکسن، 2012). شبکه های عصبی مصنوعی (ANN) و رگرسيون بردار پشتیبان (SVR) دو الگوريتم يادگيري ماشيني هستند که عمدتاً براي پيش بيني قيمت سهام و شاخص هاي بازار سهام مورد استفاده قرار می گیرند. هر الگوریتم روش منحصر به خود را برای یادگیری الگوها دارد. ژانگ و وو (2009) شبکه عصبی برگشتی را با یک بهینه سازی شیمیایی بهبود یافته باکتریایی (IBCO) به صورت یکپارچه درآوردند. آنها توانایی روش پیشنهادی خود را در زمینه پیش بینی شاخص سهام هم برای دوره کوتاه مدت (روز بعد) و هم بلند مدت (15 روز) نشان دادند. نتایج شبیه سازی نشان دهنده عملکرد برتر روش پیشنهادی بود. در مطالعات انجام شده توسط اسدی، هادوندی، مهمانپذیر و ناخوستین (2012)، برای یادگیری شبکه های عصبی پیشخور ، ترکیبی از روش های پیش پردازش داده ها، الگوریتم های ژنتیک و الگوریتم لونبرگ- مارکاد (LM) استفاده شده است. آن ها از روش های پیش پردازش داده مانند انتقال داده و انتخاب متغیرهای ورودی برای بهبود دقت مدل استفاده کردند. نتایج حاصل نشان داد که روش پیشنهادی قادر به مقابله با نوسانات ارزش بازار سهام بوده و همچنین از دقت پیش بینی خوبی برخوردار است. برای آموزش دادن به شبکه عصبی تابع پایه شعاعی (RBFNN)، الگوریتم ازدحام ماهی های مصنوعی (AFSA) توسط شن، گوا، و وو (2011) معرفی گردید. آزمایشات آن ها بر روی شاخص سهام بورس شانگهای نشان داد که RBF بهینه شده توسط AFSA یک الگوریتم آسان برای استفاده و با دقت قابل ملاحظه است. اوو و وانگ (2009) برای پیش بینی روند حرکتی قیمت شاخص سهام هنگ سنگ بازار سهام هنگ کنگ، از 10 روش داده کاوی استفاده کردند. این روش ها شامل تجزیه و تحلیل افتراقی خطی (LDA)، تحلیل افتراقی درجه دوم (QDA)، الگوریتم K-نزدیکترین همسایه، الگوریتم دسته بندی بیز براساس تابع برآورد کرنل ، مدل لاجیت ، طبقه بندی درختی، شبکه عصبی، طبقه بندی بیزی با فرایند گاوسی، ماشین بردار پشتیبانی (SVM) و حداقل مربعات ماشین بردار پشتیبانی (LS-SVM) می باشد. نتایج تجربی نشان داد که عملکرد پیش بینی مدل های ماشین بردار پشتیبانی (SVM) و حداقل مربعات ماشین بردار پشتیبانی (LS-SVM) بهتر از سایر مدل ها بود. هادوندي، قنبری و نغمه عباسيان (2010) براي پيش بيني شاخص بورس عرضه، مدل هوش هيجاني هوشمند را پیشنهاد دادند. این مدل، ترکیبی از الگوریتم های ژنتیک و شبکه های عصبی پیشخور است. اخیراً ماشین بردار پشتیبانی (SVM) (وپنیک ، 1999) محبوبیت فراوانی یافته و به عنوان یک تکنولوژی پیشرفته برای کاربردهای رگرسیون و طبقه بندی در نظر گرفته شده است. کاظم، شریفی، حسین، صابری و حسین (2013) یک مدل پیش بینی مبتنی بر نقشه برداری آشوب، الگوریتم کرم شب تاب و رگرسیون بردار پشتیبانی (SVR) را برای پیش بینی قیمت بازار سهام پیشنهاد نمودند. مدل SVR-CFA که اخیراً در این مطالعه معرفی گردید، با SVR-GA (الگوریتم ژنتیک)، SVR-CGA (الگوریتم ژنتیک هرج و مرج)، SVR-FA (الگوریتم کرم شب تاب)، ANN و ANFIS مقایسه گردید و نتایج حاصل حاکی از آن بود که SVR مدل SVR-CFA بهتر از سایر مدل ها عمل کرد. پای، لین، لین و چانگ (2010) برای پیش بینی داده های سری زمانی فصلی، یک مدل رگرسیون بردار فصلی پشتیبانی (SSVR) را توسعه دادند. آن ها به منظور انتخاب سه پارامتر مدل SSVR از الگوریتم های ژنتیک ترکیبی و جستجوی ممنوعه (GAnTS) استفاده نمودند. آنها همچنین برای پیش بینی بر روی مجموعه داده های مشابه، دو مدل پیش بینی دیگر به نام های سری زمانی میانگین متحرک انباشته خود رگرسیون (SARIMA) و رگرسیون بردار پشتیبانی (SVR) را اعمال کردند. نتایج تجربی نشان داد که عملکرد SSVR از لحاظ دقت پیش بینی بهتر از هر دو مدل SVR و SARIMA بهتر می باشد. هوانگ و وو (2008) به منظور پیش بینی تحولات آینده شاخص های مختلف سهام، با یکپارچه سازی الگوریتم ژنتیک مبتنی بر مقیاس زمانی بهینه استخراج شده ماشین بردار پشتیبانی، یک مدل پیش بینی ترکیبی جدید توسعه دادند که برای دقت های مقیاس زمانی چندگانه و یک رگرسور غیر پارامتری انعطاف پذیر استفاده می شود. مدل پیشنهادی در مقایسه با ماشین های بردار پشتیبانی (SVM) خالص، مدل های GARCH سنتی و شبکه های عصبی از عملکرد بهتری برخوردار است. کاهش خطای مربع میانگین ریشه معنی دار بود. چنگ، ژو و وانگ (2012) پیش بینی سری زمانی مالی را با استفاده از الگوریتم های یادگیری گروهی پیشنهاد دادند. الگوریتم-های گروهی در ارتقای عملکرد یادگیرندگان پایه قدرتمند بودند. آلدین، دینور و انتظاری (2012) در مطالعه پیش بینی حرکت قیمت شاخص بورس تهران (TEPIX)، اثربخشی استفاده از شاخص های فنی مانند میانگین متحرک، RSI، CCI، MACD و غیره را مورد بررسی قرار دادند. این مقاله بر روی پیش بینی ارزش آینده شاخص های بازار سهام تمرکز دارد. پیش بینی ها بر اساس 1 تا 10، 15 و 30 روز پیش انجام شده است. پیشینه و ادبیات پژوهش نشان می دهد که روش های موجود برای وظیفه-ای که این مقاله بر روی آن تمرکز دارد، فقط از یک لایه پیش بینی استفاده می کند که پارامترهای آماری را به عنوان ورودی می گیرد و خروجی نهایی را می دهد. در این روش های موجود، مقدار پارامترهای آماری روز t اُم به عنوان ورودی برای پیش بینی قیمت یا ارزش پایان روز (t+n)اُم مورد استفاده قرار می گیرد (t یک روز جاری است). در چنین سناریوهایی احساس می شود هنگامی که مقدار n افزایش می یابد، پیش بینی به طور فزاینده ای بر اساس مقادیر پارامترهای آماری است و در نتیجه به اندازه کافی دقیق نیست. از این بحث ها به روشنی می توان فهمید که بایستی این مشکل را حل نمود و پیش بینی دو مرحله ای می تواند این شکاف را به حداقل برساند و مرحله خطا کاهش را کاهش دهد. تصور بر این است که موفقیت مدل پیشنهادی دو مرحله ای واقعاً می تواند سهم قابل توجهی در تحقیق داشته باشد؛ زیرا می توان این روش را برای سایر وظایف پیش بینی مانند پیش بینی، برآورد مصرف انرژی، پیش بینی GDP و غیره تعمیم داد. روش ترکیبی دو مرحله ای که در این مقاله پیشنهاد شده است، شامل رگرسيون بردار پشتیبانی (SVR) در مرحله اول است. مرحله دوم روش ترکیبی با استفاده از شبکه عصبی مصنوعی (ANN)، جنگل تصادفی (RF) و رگرسیون بردار پشتیبانی (SVR) به مدل های پیش بینی SVR-ANN، SVR-RF و SVR-SVR می انجامد. عملکرد پیش بینی این مدل های ترکیبی با سناریوهای تک مرحله ای ANN، RF و SVR مقایسه گردیده است. سایر بخش های این مقاله به شرح زیر سازماندهی شده است. در بخش 2 به توصیف روش تک مرحله ای پرداخته شده است، در حالیکه تمرکز بخش 3 بر روی روش دو مرحله ای می باشد. بخش 4 به نتایج تجربی و بحث در مورد این نتایج می پردازد. در بخش 5 نیز به بحث و نتیجه گیری پرداخته شده است.
پیش نمایش مقاله
پیش نمایش مقاله  پیش بینی شاخص بازار سهام با استفاده از تلفیق تکنیک های یادگیری ماشین

چکیده انگلیسی

The paper focuses on the task of predicting future values of stock market index. Two indices namely CNX Nifty and S&P Bombay Stock Exchange (BSE) Sensex from Indian stock markets are selected for experimental evaluation. Experiments are based on 10 years of historical data of these two indices. The predictions are made for 1–10, 15 and 30 days in advance. The paper proposes two stage fusion approach involving Support Vector Regression (SVR) in the first stage. The second stage of the fusion approach uses Artificial Neural Network (ANN), Random Forest (RF) and SVR resulting into SVR–ANN, SVR–RF and SVR–SVR fusion prediction models. The prediction performance of these hybrid models is compared with the single stage scenarios where ANN, RF and SVR are used single-handedly. Ten technical indicators are selected as the inputs to each of the prediction models.