دانلود مقاله ISI انگلیسی شماره 89968
ترجمه فارسی عنوان مقاله

بهینه سازی بیزی برای فضاهای جستجوی گرافیک ساختاری: بهینه سازی معماری های ترکیبی عمیق چندجملهای

عنوان انگلیسی
Bayesian optimization on graph-structured search spaces: Optimizing deep multimodal fusion architectures
کد مقاله سال انتشار تعداد صفحات مقاله انگلیسی
89968 2018 22 صفحه PDF
منبع

Publisher : Elsevier - Science Direct (الزویر - ساینس دایرکت)

Journal : Neurocomputing, Volume 298, 12 July 2018, Pages 80-89

ترجمه کلمات کلیدی
یادگیری عمیق، بهینه سازی بیزی، روش های هسته ای،
کلمات کلیدی انگلیسی
Deep learning; Bayesian optimization; kernel methods;
ترجمه چکیده
یک تست عمومی برای یادگیری عمیق شناخت چندجمله ای از فعالیت های انسان یا ژست شامل ورودی های متنوع مانند ویدئو، صدا، اسکلت و تصاویر عمقی بوده است. معماری های فراگیر در این زمینه به دلیل توانایی آنها در ترکیب تجارب مدلا در سطوح مختلف استخراج ویژگی های غیرخطی، از این مشکلات پیشی گرفته اند. با این حال، طراحی یک معماری بهینه که در آن به منظور جلوگیری از چنین بازنویسی آموخته شده است، عمدتا یک تلاش مهندسی انحصاری نیست. ما بهینه سازی ساختار فیوژن را به عنوان یک جستجوی فوق العاده پارامتر می پردازیم و آن را به عنوان یک مشکل بهینه سازی گسسته در چارچوب بهینه سازی بیزی می پردازیم. ما دو روش برای تخمین ساختارهای شباهت های ساختاری در فضای جستجو معماری های چندبخش ساختار درختی ارائه می دهیم و اثربخشی آنها را در دو مسئله تشخیص فعالیت های چندملیتی انسان چالش برانگیز نشان می دهد.
پیش نمایش مقاله
پیش نمایش مقاله  بهینه سازی بیزی برای فضاهای جستجوی گرافیک ساختاری: بهینه سازی معماری های ترکیبی عمیق چندجملهای

چکیده انگلیسی

A popular testbed for deep learning has been multimodal recognition of human activity or gesture involving diverse inputs like video, audio, skeletal pose and depth images. Deep learning architectures have excelled on such problems due to their ability to combine modality representations at different levels of nonlinear feature extraction. However, designing an optimal architecture in which to fuse such learned representations has largely been a non-trivial human engineering effort. We treat fusion structure optimization as a hyperparameter search and cast it as a discrete optimization problem under the Bayesian optimization framework. We propose two methods to compute structural similarities in the search space of tree-structured multimodal architectures, and demonstrate their effectiveness on two challenging multimodal human activity recognition problems.