ترجمه فارسی عنوان مقاله
استفاده از شبکهی عصبیِ ART2 و شبکهی بیزی برای خودکار سازیِ فرآیند ساخت هستیشناسی
عنوان انگلیسی
Using ART2 Neural Network and Bayesian Network for Automating the Ontology Constructing Process
کد مقاله | سال انتشار | تعداد صفحات مقاله انگلیسی |
---|---|---|
29148 | 2012 | 10 صفحه PDF |
منبع
Publisher : Elsevier - Science Direct (الزویر - ساینس دایرکت)
Journal : Procedia Engineering, Volume 29, 2012, Pages 3914–3923
فهرست مطالب ترجمه فارسی
چکیده
کلمات کلیدی
1.مقدمه
2. ساخت هستیشناسی
2.1. تحلیل اسناد
جدول 1. عبارتهای استخراجشده بر اساس متد مقدار C
شکل 1. معماریِ سیستم یادگیریِ هستیشناسی
جدول 2. بخشهایی از ماتریس عبارت-سندِ TF-IDF
2.2. خوشهبندیِ اسناد
جدول 3. محاسبهی TF-IDF برای برخی عبارتها در خوشهی اول
2.3. یادگیریِ روابط هستیشناسی
2.3.1. یادگیریِ رابطهی «است یک»
شکل 2. هستیشناسیِ فناوریِ اطلاعات
2.3.2. یادگیریِ رابطهی «بخشی از»
2.4. یادگیریِ وقایع هستیشناسی
3. ارزیابیِ عملکردیِ سیستم
3.1. ارزیابی بر اساس دیدگاه متخصص
3.2. ارزیابی عملکرد سیستم بر اساس برنامهی توسعهی جستار
3.2.1. الگوریتم توسعهی جستار پیشنهادی بر اساس هستیشناسی
3.2.2. ارزیابیِ عملکردیِ سیستم بازیابی اطلاعات
شکل 3. نمودار دقت میانگین برای دو وضعیت: نبود هستیشناسی و توسعهی جستار هستیشناسی
4. نتیجهگیری و آثار آینده
کلمات کلیدی
1.مقدمه
2. ساخت هستیشناسی
2.1. تحلیل اسناد
جدول 1. عبارتهای استخراجشده بر اساس متد مقدار C
شکل 1. معماریِ سیستم یادگیریِ هستیشناسی
جدول 2. بخشهایی از ماتریس عبارت-سندِ TF-IDF
2.2. خوشهبندیِ اسناد
جدول 3. محاسبهی TF-IDF برای برخی عبارتها در خوشهی اول
2.3. یادگیریِ روابط هستیشناسی
2.3.1. یادگیریِ رابطهی «است یک»
شکل 2. هستیشناسیِ فناوریِ اطلاعات
2.3.2. یادگیریِ رابطهی «بخشی از»
2.4. یادگیریِ وقایع هستیشناسی
3. ارزیابیِ عملکردیِ سیستم
3.1. ارزیابی بر اساس دیدگاه متخصص
3.2. ارزیابی عملکرد سیستم بر اساس برنامهی توسعهی جستار
3.2.1. الگوریتم توسعهی جستار پیشنهادی بر اساس هستیشناسی
3.2.2. ارزیابیِ عملکردیِ سیستم بازیابی اطلاعات
شکل 3. نمودار دقت میانگین برای دو وضعیت: نبود هستیشناسی و توسعهی جستار هستیشناسی
4. نتیجهگیری و آثار آینده
ترجمه کلمات کلیدی
(
هستی شناسی -
شبکه عصبی -
مدت فرکانس فرکانس معکوس سند (
ارزش روش -
شبکه های بیزی -
الگوهای - نحوی -
کلمات کلیدی انگلیسی
Ontology,
ART Neural Network,
Term Frequency–Inverse Document Frequency (TF-IDF,
C-value Method,
Bayesian network,
Lexico-Syntactic Patterns,
ترجمه چکیده
هستیشناسی یکی از مبناهای اساسی وب معنایی است. استفادهی رایج از اطلاعات هستی شناسی در تسهیم اطلاعات و مدیریت دانش نیازمند رویکردهای موثر و بهینه برای توسعهی هستیشناسی است. یادگیریِ هستی شناسی، که به دنبال کشف دانش هستیشناسی از انواع مختلف داده به صورت خودکار و یا نیمه خودکار است، میتواند به تنگناهای کسب هستیشناسی در توسعه چیره شود. در این مقاله، یک متد نوین و خودکار برای یادگیریِ هستیشناسی ارائه شده است. ابتدا، اسناد مربوط به دامنه جمعآوری میشوند. دوم، متد مقدار C برای استخراج اطلاعات معنادار از اسناد پیادهسازی میشود. سپس یک شبکهی عصبیِ ART برای خوشهبندیِ اسناد استفاده میشود، و وزن عبارتها توسط متد TF-IDF محاسبه میشود تا کلمههای کلیدیِ مربوطه برای هر خوشه به دست آید. سپس، شبکهی بیزی و الگوهای معنایی-ساختاری اعمال میشود تا هستیشناسیِ اولیه به دست آید. در نهایت، هستیشناسیِ پیشنهادی توسط دیدگاههای متخصصها و با استفاده از هستیشناسی برای اهداف توسعهی جستار ارزیابی شده است. نتایج اولیه نشان می دهد که متد یادگیریِ هستیشناسیِ پیشنهادی دارای دقت بالاتری نسبت به مطالعات مشابه است.
ترجمه مقدمه
هستیشناسیها به صور مشخصهای رسمی و صریح از مبهومسازیِ مشترک تعریف میشوند [1]. آنها جزء اساسی بسیاری از حوزههایی هستند که از نظر دانش بسیار حجیم هستند، مانند وب معنایی [2]، مدیریت دانش و تجارت الکترونیک. ساخت هستیشناسیهای دامنه بر روی مدلسازهای دامنه و مهندسان دانش وابسته است، که معمولاً غوطهور در سایز، پیچیدگی و پویایی دامنهی به خصوصی هستند [3]. در نتیجه، تعریف هستیشناسیهای دامنهی فراگیر مانعی است که پروژههای بسیار کمی میتوانند بر آن چیره شوند. بر اساس همین دلایل، امروزه متدی مورد نیاز است که میتواند ساخت هستیشناسیهای دامنه را حل و یا حداقل تسهیل کند. متدهای یادگیریِ هستیشناسیِ خودکار اجازه میدهد از نظر زمانی کاهش انجام شود. Zhou یک طبقهبندی برای تکنیکهای یادگیریِ هستیشناسی ارائه میکند که از سه دسته تشکیل شده است: تکنیکهای مبتنی بر آمار، مبتنی بر قانون و هیبرید [4]. Shamsfard، رویکرد یادگیریِ هستیشناسی را به آماری و نمادین طبقهبندی میکند. رویکردهای نمادین، رویکردهای نمادین، مبتنی بر زبانشناسی و قالب هستند. متدهای اکتشافی را میتوان برای تسهیل هر رویکرد به کار برد [2].
در این مقاله، متدهای یادگیریِ هستیشناسیِ مختلف را ترکیب کردهایم: مانند آماری، زبانی و مبتنی بر الگو تا یک سیستم یادگیریِ ستیشناسیِ خودکار در دامنهی توسعهی جستار ارائه کنیم. برای این هدف، متدهای پردازش زبان طبیعی استفاده شدهاند مانند: تخلیهی کلمههای توقفی، پردازش زبانی، پردازش آماری و غیره، که بر روی مجموعهی اسناد مربوط به دامنه پیاده شدهاند. در ادامه، با استفاده از متد مقدار C، عبارتهای اصلی را استخراج کردهایم، و پس از آن ماتریس عبارت-سند را ساختیم. سپس، این ماتریس را با شبکهی عصبیِ ART خوشهبندی کردیم. برای انتخاب داوطلبان هر خوشه، متد TF-IDF را پیادهسازی کرده و عبارت دارای بالاترین وزن را به عنوان یک مورد انتخاب کردیم. به علاوه، شبکهی بیزی برای ساخت سلسلهمراتب هستیشناسی پیادهسازی شده است. سپس از الگوهای زبانی-ساختاری استفاده کردهایم تا روابط غیر طبقهای و وقایع هستیشناسی را استخراج کنیم. بنابراین، هستیشناسیِ اولیه توسط متخصصان این حوزه ساخته و ارزیابی شدند. ادامهی مقاله به این صورت سازمان یافته است: بخش 2 معماریِ سیستم یادگیریِ هستیشناسی را به صورت گام به گام به همراه نتایج تجربیِ دیگر ارائه میکند. در بخش 3، ارزیابیِ عملکردی سیستم توصیف میشود. نتیجهگیریِ مقاله و جهتهای پژوهشهای آینده در بخش 4 آمده است.