دانلود مقاله ISI انگلیسی شماره 151800
ترجمه فارسی عنوان مقاله

دوره ای در تجزیه و تحلیل داده های بزرگ

عنوان انگلیسی
A course on big data analytics
کد مقاله سال انتشار تعداد صفحات مقاله انگلیسی
151800 2018 30 صفحه PDF
منبع

Publisher : Elsevier - Science Direct (الزویر - ساینس دایرکت)

Journal : Journal of Parallel and Distributed Computing, Available online 5 March 2018

ترجمه کلمات کلیدی
برنامه تحصیلی، تحصیلات کارشناسی اطلاعات بزرگ، پردازش ابری،
کلمات کلیدی انگلیسی
Curriculum; Undergraduate education; Big data; Cloud computing;
پیش نمایش مقاله
پیش نمایش مقاله  دوره ای در تجزیه و تحلیل داده های بزرگ

چکیده انگلیسی

This report details a course on big data analytics designed for undergraduate junior and senior computer science students. The course is heavily focused on projects and writing code for big data processing. It is designed to help students learn parallel and distributed computing frameworks and techniques commonly used in industry. The curriculum includes a progression of projects requiring increasingly sophisticated big data processing ranging from data preprocessing with Linux tools, distributed processing with Hadoop MapReduce and Spark, and database queries with Hive and Google’s BigQuery. We discuss hardware infrastructure and experimentally evaluate the cost/benefit of an on-premise server versus Amazon’s Elastic MapReduce. Finally, we showcase outcomes of our course in terms of student engagement and anonymous student feedback.