دانلود مقاله ISI انگلیسی شماره 29148
ترجمه فارسی عنوان مقاله

استفاده از شبکه‌ی عصبیِ ART2 و شبکه‌ی بیزی برای خودکار سازیِ فرآیند ساخت هستی‌شناسی

عنوان انگلیسی
Using ART2 Neural Network and Bayesian Network for Automating the Ontology Constructing Process
کد مقاله سال انتشار تعداد صفحات مقاله انگلیسی
29148 2012 10 صفحه PDF
منبع

Publisher : Elsevier - Science Direct (الزویر - ساینس دایرکت)

Journal : Procedia Engineering, Volume 29, 2012, Pages 3914–3923

فهرست مطالب ترجمه فارسی
چکیده

کلمات کلیدی

1.مقدمه

2. ساخت هستی‌شناسی

2.1. تحلیل اسناد

جدول 1. عبارت‌های استخراج‌شده بر اساس متد مقدار C

شکل 1. معماریِ سیستم یادگیریِ هستی‌شناسی

جدول 2. بخش‌هایی از ماتریس عبارت-سندِ TF-IDF

2.2. خوشه‌بندیِ اسناد

جدول 3. محاسبه‌ی TF-IDF برای برخی عبارت‌ها در خوشه‌ی اول 

2.3. یادگیریِ روابط هستی‌شناسی

2.3.1. یادگیریِ رابطه‌ی «است یک»

شکل 2. هستی‌شناسیِ فناوریِ اطلاعات

2.3.2. یادگیریِ رابطه‌ی «بخشی از»

2.4. یادگیریِ وقایع هستی‌شناسی

3. ارزیابیِ عملکردیِ سیستم

3.1. ارزیابی بر اساس دیدگاه متخصص

3.2. ارزیابی عملکرد سیستم بر اساس برنامه‌ی توسعه‌ی جستار

3.2.1. الگوریتم توسعه‌ی جستار پیشنهادی بر اساس هستی‌شناسی

3.2.2. ارزیابیِ عملکردیِ سیستم بازیابی اطلاعات

شکل 3. نمودار دقت میانگین برای دو وضعیت: نبود هستی‌شناسی و توسعه‌ی جستار هستی‌شناسی

4. نتیجه‌گیری و آثار آینده
ترجمه کلمات کلیدی
( هستی شناسی - شبکه عصبی - مدت فرکانس فرکانس معکوس سند ( ارزش روش - شبکه های بیزی - الگوهای - نحوی -
کلمات کلیدی انگلیسی
Ontology, ART Neural Network, Term Frequency–Inverse Document Frequency (TF-IDF, C-value Method, Bayesian network, Lexico-Syntactic Patterns,
ترجمه چکیده
هستی‌شناسی یکی از مبناهای اساسی وب معنایی است. استفاده‌ی رایج از اطلاعات هستی شناسی در تسهیم اطلاعات و مدیریت دانش نیازمند رویکردهای موثر و بهینه برای توسعه‌ی هستی‌شناسی است. یادگیریِ هستی شناسی، که به دنبال کشف دانش هستی‌شناسی از انواع مختلف داده به صورت خودکار و یا نیمه خودکار است، می‌تواند به تنگناهای کسب هستی‌شناسی در توسعه چیره شود. در این مقاله، یک متد نوین و خودکار برای یادگیریِ هستی‌شناسی ارائه شده است. ابتدا، اسناد مربوط به دامنه جمع‌آوری می‌شوند. دوم، متد مقدار C برای استخراج اطلاعات معنادار از اسناد پیاده‌سازی می‌شود. سپس یک شبکه‌ی عصبیِ ART برای خوشه‌بندیِ اسناد استفاده می‌شود، و وزن عبارت‌ها توسط متد TF-IDF محاسبه می‌شود تا کلمه‌های کلیدیِ مربوطه برای هر خوشه به دست آید. سپس، شبکه‌ی بیزی و الگوهای معنایی-ساختاری اعمال می‌شود تا هستی‌شناسیِ اولیه به دست آید. در نهایت، هستی‌شناسیِ پیشنهادی توسط دیدگاه‌های متخصص‌ها و با استفاده از هستی‌شناسی برای اهداف توسعه‌ی جستار ارزیابی شده است. نتایج اولیه نشان می دهد که متد یادگیریِ هستی‌شناسیِ پیشنهادی دارای دقت بالاتری نسبت به مطالعات مشابه است.
ترجمه مقدمه
هستی‌شناسی‌ها به صور مشخصه‌ای رسمی و صریح از مبهوم‌سازیِ مشترک تعریف می‌شوند [1]. آن‌ها جزء اساسی بسیاری از حوزه‌هایی هستند که از نظر دانش بسیار حجیم هستند، مانند وب معنایی [2]، مدیریت دانش و تجارت الکترونیک. ساخت هستی‌شناسی‌های دامنه بر روی مدل‌سازهای دامنه و مهندسان دانش وابسته است، که معمولاً غوطه‌ور در سایز، پیچیدگی و پویایی دامنه‌ی به خصوصی هستند [3]. در نتیجه، تعریف هستی‌شناسی‌های دامنه‌ی فراگیر مانعی است که پروژه‌های بسیار کمی می‌توانند بر آن چیره شوند. بر اساس همین دلایل، امروزه متدی مورد نیاز است که می‌تواند ساخت هستی‌شناسی‌های دامنه را حل و یا حداقل تسهیل کند. متدهای یادگیریِ هستی‌شناسیِ خودکار اجازه می‌دهد از نظر زمانی کاهش انجام شود. Zhou یک طبقه‌بندی برای تکنیک‌های یادگیریِ هستی‌شناسی ارائه می‌کند که از سه دسته تشکیل شده است: تکنیک‌های مبتنی بر آمار، مبتنی بر قانون و هیبرید [4]. Shamsfard، رویکرد یادگیریِ هستی‌شناسی را به آماری و نمادین طبقه‌بندی می‌کند. رویکردهای نمادین، رویکردهای نمادین، مبتنی بر زبان‌شناسی و قالب هستند. متدهای اکتشافی را می‌توان برای تسهیل هر رویکرد به کار برد [2]. در این مقاله، متدهای یادگیریِ هستی‌شناسیِ مختلف را ترکیب کرده‌ایم: مانند آماری، زبانی و مبتنی بر الگو تا یک سیستم یادگیریِ ستی‌شناسیِ خودکار در دامنه‌ی توسعه‌ی جستار ارائه کنیم. برای این هدف، متدهای پردازش زبان طبیعی استفاده شده‌اند مانند: تخلیه‌ی کلمه‌های توقفی، پردازش زبانی، پردازش آماری و غیره، که بر روی مجموعه‌ی اسناد مربوط به دامنه پیاده شده‌اند. در ادامه، با استفاده از متد مقدار C، عبارت‌های اصلی را استخراج کرده‌ایم، و پس از آن ماتریس عبارت-سند را ساختیم. سپس، این ماتریس را با شبکه‌ی عصبیِ ART خوشه‌بندی کردیم. برای انتخاب داوطلبان هر خوشه، متد TF-IDF را پیاده‌سازی کرده و عبارت دارای بالاترین وزن را به عنوان یک مورد انتخاب کردیم. به علاوه، شبکه‌ی بیزی برای ساخت سلسله‌مراتب هستی‌شناسی پیاده‌سازی شده است. سپس از الگوهای زبانی-ساختاری استفاده کرده‌ایم تا روابط غیر طبقه‌ای و وقایع هستی‌شناسی را استخراج کنیم. بنابراین، هستی‌شناسیِ اولیه توسط متخصصان این حوزه ساخته و ارزیابی شدند. ادامه‌ی مقاله به این صورت سازمان یافته است: بخش 2 معماریِ سیستم یادگیریِ هستی‌شناسی را به صورت گام به گام به همراه نتایج تجربیِ دیگر ارائه می‌کند. در بخش 3، ارزیابیِ عملکردی سیستم توصیف می‌شود. نتیجه‌گیریِ مقاله و جهت‌های پژوهش‌های آینده در بخش 4 آمده است.
پیش نمایش مقاله
پیش نمایش مقاله  استفاده از شبکه‌ی عصبیِ ART2 و شبکه‌ی بیزی برای خودکار سازیِ فرآیند ساخت هستی‌شناسی

چکیده انگلیسی

Ontology is one of the fundamental cornerstones of the semantic Web. The pervasive use of ontologies in information sharing and knowledge management calls for efficient and effective approaches to ontology development. Ontology learning, which seeks to discover ontological knowledge from various forms of data automatically or semiautomatically, can overcome the bottleneck of ontology acquisition in ontology development.. In this article a novel automated method for ontology learning is proposed. First, domain-related documents were collected. Secondly, the C-value method was implemented for extracting meaningful terms from documents. Then, an ART neural network was used to cluster documents, and terms’ weight was calculated by TF–IDF method in order to find candidate keyword for each cluster. Next, the Bayesian network and lexico-syntactic patterns were applied to construct the initial ontology. Finally, the proposed ontology was evaluated by expert's views and using the ontology for query expansion purpose. The primary results show that the proposed ontology learning method has higher precision than similar studies.