دانلود مقاله ISI انگلیسی شماره 150260
ترجمه فارسی عنوان مقاله

یک الگوریتم یادگیری تقویت جدید برای تعبیه شبکه مجازی

عنوان انگلیسی
A novel reinforcement learning algorithm for virtual network embedding
کد مقاله سال انتشار تعداد صفحات مقاله انگلیسی
150260 2018 9 صفحه PDF
منبع

Publisher : Elsevier - Science Direct (الزویر - ساینس دایرکت)

Journal : Neurocomputing, Volume 284, 5 April 2018, Pages 1-9

ترجمه کلمات کلیدی
تعبیه شبکه مجازی، تقویت یادگیری، شبکه سیاست گرادیان سیاست،
کلمات کلیدی انگلیسی
Virtual network embedding; Reinforcement learning; Policy network; Policy gradient;
ترجمه چکیده
مجازی سازی شبکه، سهم یک شبکه فیزیکی را در بین چندین شبکه مجازی را فعال می کند. تعبیه شبکه مجازی، اثربخشی استفاده از منابع شبکه را تعیین می کند. الگوریتم های نقشه برداری اکتشافی سنتی از روش های استاتیک پیروی می کنند، بنابراین نمی توانند به طور خودکار بهینه سازی شوند، که منجر به تصمیم گیری های غیرقابتی و رتبه بندی می شود. برای حل این مشکل، یک روش یادگیری تقویت کننده را برای تعبیه شبکه مجازی معرفی می کنیم. در این مقاله، یک شبکه سیاستی را بر اساس یادگیری تقویتی طراحی و پیاده سازی می کنیم تا تصمیم گیری های نقشه برداری گره انجام شود. ما برای رسیدن به بهینه سازی به طور خودکار با استفاده از شیوه سیاست گذاری، با آموزش شبکه سیاست با داده های تاریخی بر اساس درخواست های شبکه مجازی، از گرادیان سیاست استفاده می کنیم. برای کسب اطلاعات بیشتر، این کار اولین بار است که از داده های درخواست های تاریخی برای بهینه سازی جاسازی شبکه به صورت خودکار استفاده می کند. عملکرد الگوریتم تعبیه پیشنهاد شده در مقایسه با دو الگوریتم دیگر که از قوانین مصنوعی بر اساس رتبه بندی گره استفاده می کنند، ارزیابی می شود. نتایج شبیه سازی نشان می دهد که یادگیری تقویت کننده ما قادر است از درخواست های تاریخی یاد بگیرد و از دو الگوریتم دیگر جاسازی شده بهتر عمل کند.
پیش نمایش مقاله
پیش نمایش مقاله  یک الگوریتم یادگیری تقویت جدید برای تعبیه شبکه مجازی

چکیده انگلیسی

Network virtualization enables the share of a physical network among multiple virtual networks. Virtual network embedding determines the effectiveness of utilization of network resources. Traditional heuristic mapping algorithms follow static procedures, thus cannot be optimized automatically, leading to sub-optimal ranking and embedding decisions. To solve this problem, we introduce a reinforcement learning method to virtual network embedding. In this paper, we design and implement a policy network based on reinforcement learning to make node mapping decisions. We use policy gradient to achieve optimization automatically by training the policy network with the historical data based on virtual network requests. To the best of our knowledge, this work is the first to utilize historical requests data to optimize network embedding automatically. The performance of the proposed embedding algorithm is evaluated in comparison with two other algorithms which use artificial rules based on node ranking. Simulation results show that our reinforcement learning is able to learn from historical requests and outperforms the other two embedding algorithms.