دانلود مقاله ISI انگلیسی شماره 78945
ترجمه فارسی عنوان مقاله

یک شبکه‌ی عصبی حداقل- حداکثر فازی بهبودیافته برای خوشه‌بندی اطلاعات و کاربردهای آن برای نظارت کیفیت توان

عنوان انگلیسی
A modified fuzzy min–max neural network for data clustering and itsapplication to power quality monitoring
کد مقاله سال انتشار تعداد صفحات مقاله انگلیسی
78945 2015 11 صفحه PDF
منبع

Publisher : Elsevier - Science Direct (الزویر - ساینس دایرکت)

Journal : Applied Soft Computing, Volume 28, March 2015, Pages 19–29

فهرست مطالب ترجمه فارسی
چکیده

معرفی

مرور کاراهای قبلی

خوشه‌بندی سلسله مراتبی

خوشه‌بندی مبتنی بر مرکز

خوشه‌بندی مبتنی بر توزیع

شبکه‌ی خوشه‌بندی حداقل- حداکثر فازی

اصلاحات مورد نظر

جدول1: شبه کد برای شبکه‌ی MFMM.

مطالعات تجربی

مطالعه‌ی معیار1

جدول2: توصیف و منبع مجموعه اطلاعات.

شکل3: تکمیل ساختارهای هایپرباکس در MFMM با استفاده از مجموعه اطلاعات پتالز (گلبرگ).

شکل4: تکمیل ساختارهای هایپرباکس در MFMM با استفاده از مجموعه اطلاعات R15.

جدول3: نتایج مجموعه اطلاعات معیار.

مطالعه‌ی معیار2

جدول5: مقایسه‌ی امتیازات CCC بین FMM، MFMM و نتایج گزارش شده در مرجع [28].

جدول6: امتیازات CCC به همراه تغییر اندازه‌ی هایپرباکس در MFMM.

جدول7: تعداد خوشه‌های تولید شده توسط MFMM.

مطالعه‌ی معیار3

جدول9: توصیف و منبع مجموعه‌های اطلاعات

جدول10: مقایسه‌ی کارایی بین MFMM و گزارش‌های مرجع [59].

مطالعه‌ی موردی دنیای واقعی

شکل5: نظارت کیفیت توان با استفاده از ثبت کننده‌ی توان سه‌فاز.

جدول12: نتایج موضوع FMM و MFMM برای تغییر اندازه‌های هایپرباکس.

جدول13: نتایج روش‌های خوشه‌بندی میانگین- k و میانگین- c.

خلاصه
ترجمه کلمات کلیدی
خوشه بندی؛ شبکه‌ی عصبی حداقل حداکثر فازی؛ مطالعه معیار؛ نظارت بر کیفیت توان
کلمات کلیدی انگلیسی
Clustering; Fuzzy min–max neural network; Benchmark study; Power quality monitoring
ترجمه چکیده
وقتی هیچ‌گونه اطلاعاتی در دسترس نیست، خوشه‌بندی روشی مفید و کاربردی برای دسته‌بندی اطلاعات در گروه‌ها یا خوشه‌های با معنی است. در این مقاله، یک شبکه عصبی خوشه‌بندی حداقل- حداکثر فازی بهبودیافته (MFMM) مورد بررسی قرار گرفته است. کارآیی آن برای مقابله با وظایف مربوط به نظارت بر کیفیت توان اثبات شده است. در ابتدا مروری بر روش‌های خوشه‌بندی مختلف ارائه می‌شود. برای ارزیابی مدل MFMM مورد نظر، یک مقایسه‌ی ساختاری با استفاده از مجموعه اطلاعات معیار مربوط به مسائل خوشه‌بندی انجام می‌شود. نتایج به دست آمده قابل مقایسه با نتایج گزارش شده در مراجع قبلی می‌باشند. سپس، حالت مربوط به دنیای واقعی بر روی نظارت بر کیفیت توان اجرا می‌شود. نتایج به دست آمده با نتایج روش‌های خوشه‌بندی میانگین- c و میانگین- k مقایسه می‌شود. نتایج آزمایش به طور امیدوار کننده‌ای پتانسیل MFMM در انجام کارهای خوشه‌بندی اطلاعات و قابلیت کاربردی آن در حوزه‌ی سیستم‌های توان را نشان می‌دهند.
ترجمه مقدمه
فرآیندهای تحلیل اطلاعات می‌توانند به طور گسترده به صورت اکتشافی یا تاییدی و مبتنی بر مدل‌های مورد استفاده برای پردازش منبع اطلاعاتی دسته‌بندی شوند [1]. صرف نظر از روش‌های مورد استفاده در این دو دسته، یک جزء کلیدی عبارت است از گروه‌بندی اطلاعات با استفاده از خوبیِ تناسب برای یک مدل فرضی یا خوشه‌بندی از طریق تحلیل می‌باشد [2]. این یک روش غیر نظارتی است که اطلاعات را در گروه‌های مختلف دسته‌بندی می‌کند به طوری که اهداف یک خوشه در مقایسه با اهداف خوشه‌ی دیگر خیلی شبیه به هم هستند [3]. در روش‌های نظارتی، اطلاعات متناظر با تعدادی از دسته‌های هدف خاص برچسب گذاری می‌شوند. در روش‌های خوشه‌بندی، نمونه‌های اطلاعاتی برچسب گذاری نمی‌شوند و چالش اصلی چگونگی دسته‌بندی آن‌ها در خوشه‌های با معنی است. با یک روش تحلیل اطلاعات پایه‌ای، خوشه‌بندی عموماً در بسیاری از کاربردها استفاده می‌شود و این کاربردها شامل بازشناخت الگو، بخش‌بندی تصویر و تخمین تابع می‌شوند [4]. برخلاف روش‌های استاتیکی استاندارد، بسیاری از روش‌های خوشه‌بندی وابسته به فرضیات نیستند؛ بنابراین در شرایطی مفید هستند که اطلاعات کمی در دسترس است یا هیچ دانش قبلی در دسترس نیست [3]. در بخش‌هایی از روش‌های خوشه‌بندی، این روش‌ها می‌توانند به طور گسترده به دو دسته تقسیم شوند: سلسله مراتبی و تفکیکی [5]. روش‌های خوشه‌بندی سلسله مراتبی به طور بازگشتی خوشه‌های تو در تو را یا در (i) یک حالت متراکم شونده قرار می‌دهند که در این حالت هر نمونه اطلاعات در خوشه‌ی خودش و در شبیه‌ترین جفت ترکیب می‌شود؛ یا (ii) خوشه‌های تو در تو را در حالت تقسیم کننده قرار می‌دهد (که به عنوان حالت بالا- پایین هم شناخته می‌شود) به طوری که همه‌ی نمونه‌های اطلاعات در یک خوشه‌ی تکی به طور بازگشتی به خوشه‌های کوچکتر تقسیم می‌شوند [5]. به عنوان یک مثال، یک دندروگرام گروه‌بندی الگوها را به گئنه‌ای ارائه می‌کند که سطح و میزان همسانی از یک الگوریتم سلسله مراتبی تولید می‌شود [1]. به عبارت دیگر، از آن‌جا که تقسیم بندی و تفکیک اطلاعات یک ساختار سلسله مراتبی را تحمیل نمی‌کنند، روش‌های خوشه‌بندی تفکیکی همه‌ی خوشه‌ها را در یک گروه قرار می‌دهند [5]. از آن‌جا که ساخت یک ساختار سلسله مراتبی (مثلا یک دندروگرام) می‌تواند به طور محاسباتی منع کننده باشد پس در کاربردهایی که همراه با مجموعه‌های اطلاعاتی بزرگ هستند، روش‌های خوشه‌بندی تفکیکی مزیت بیشتری دارند [1]. بسیاری از الگوریتم‌های خوشه‌بندی در مراجع قبلی در دسترس هستند. اساساً، خوشه‌بندی با برخی فرضیات در زمینه‌ی معیار فاصله، ساختار اطلاعات و یا تعداد خوشه‌ها انجام می‌شود [6]. در بین روش‌های خوشه‌بندی مختلف، خوشه‌بندی میانگین- k یکی از الگوریتم‌های معروف است [7]. الگوریتم خوشه‌بندی میانگین- k بصورت تکراری هر نمونه اطلاعات را با استفاده از یک معیار فاصله به نزدیک‌ترین مرکز خوشه تخصیص می‌دهد. مدل‌های ترکیبی مختلف شامل الگوریتم خوشه‌بندی میانگین- k هم در دسترس هستند، مثلاً مدل تکامل تفاضلی ترکیبی و مدل خوشه‌بندی میانگین-k [8]. یک ایراد این است که معیار فاصله‌ی تخمین زده شده می‌تواند نادرست باشد [7]. روش خوشه‌بندی معروف دیگر، روش الگوریتم میانگین- c فازی است [9،10]. بسیاری از روش‌های خوشه‌بندی فازی می‌توانند فقط نمونه‌های اطلاعاتی فضایی و سه بعدی را پردازش کنند و نمونه‌های غیر فضایی (غیر سه بعدی) را پردازش نمی‌کنند [9]. به علاوه، روش‌های خوشه‌بندی دیگری هم در دسترس هستند که شامل الگوریتم خوشه‌بندی طیفی فازی [11] و الگوریتم‌های خوشه‌بندی شبه فضایی می‌شوند[12]. در بخش‌هایی از روش‌های مبتنی بر اطلاعات، مدل‌های شبکه‌ی عصبی یادگیرنده‌ی افزایشی به علت ارتقا و پیشرفت آن‌ها در مدیریتِ مجموعه اطلاعاتِ مقیاس بالا و قابلیت‌های یادگیری توزیع شده، مزایای متعددی پیشنهاد می‌کنند [13]. یادگیری افزایشی یک روش کارآمد در تولید علم ایجاد می‌کند به گونه‌ای که اجازه‌ی کسب اطلاعات/ علمِ بیشتر بدون فراموش کردن اطلاعات/ علم قبلی را می‌دهد [14]. مزیت دیگر یادگیری افزایشی این است که همه‌ی اطلاعات آموزشی می‌توانند فوراً برای یادگیری استفاده شوند نه اینکه برای مجموعه‌ی آموزش نمایشی و انتخاب شده برای یادگیری منتظر باشیم [15]. به علاوه، نیازهای مربوط به حافظه کمتر می‌شود چون یک نمونه اطلاعات آموزشی می‌تواند هنگامی کنارگذاشته شود که برای یادگیری استفاده شده باشد [15]. در این حوزه، Simpson دو شبکه‌ی حداقل- حداکثر فازی (FMM) را مورد بررسی قرار داد که مجهز به قابلیت‌های یادگیری افزایشی بودند: یکی برای دسته‌بندی اطلاعات با یک مدل یادگیری نظارتی [16] و دیگری برای خوشه‌بندی اطلاعات با یک مدل یادگیری غیر نظارتی [17]. مبتنی بر هر دو مدل FMM [16،17] تعدادی از گونه‌ای FMM در مراجع مختلف گسترش یافته است. در کار قبلی ما، یک مدل ترکیبی شامل FMM نظارتی و خوشه‌بندی و درخت رگرسیون برای آشکارسازی خطا و نقص (FDD) در موتورهای القایی بررسی شد [18]. مدل فوق با قابلیت یادگیری برخط (online) برای مقابله با مشکلات FDD بیشتر ارتقا یافت [19]. یک شبکه‌ی FMM بهبود یافته برای مقابله با پدیده‌ی اعداد کوچک هایپرباکس‌های بزرگ ایجاد شد [20]. سپس مدل فوق با قابلیت استخراج قوانین با استفاده از الگوریتم ژنتیک ارتقا یافت [21]. یک شبکه‌ی FMM کلی با اصول انبساط و انقباض بصورت ترکیبی از هر دو روش یادگیری نظارتی و غیر نظارتی در یک مدل معرفی شد [22]. علاوه بر آن، یک شبکه‌ی FMM واکنشی که مجتمع از دو الگوریتم دسته‌بندی و خوشه‌بندی است به همراه مفهوم مکانیزم واکنش انسانی مورد بررسی قرار گرفت [23]. مبتنی بر مدل نظارتی، شبکه‌ی FMM با رشته‌های عصبی جبران‌ساز گسترش یافت به طوری که این رشته‌های عصبی مجاز به یادگیری برخط (online) بودند و در زمان مشابه فرآیند ساخت هایپرباکس را حذف می‌کردند. علاوه بر یادگیری و نمونه‌های اطلاعات دسته‌بندی شده با چندین دانه، شبکه‌ی FMM واکنشی و دانه‌ای که شامل مجموعه‌های فازی هایپرباکس برای نمایش اطلاعات چند دانه‌ای بود هم مورد بررسی قرار گرفت [25]. شبکه‌ی FMM مبتنی بر اطلاعات- هسته که در [26] بررسی شده، توابع عضویت جدیدی را به همراه دو نوع از رشته‌ها (یعنی رشته‌های دسته‌بندی و همپوشی) گسترش داد در حالی که فرآیند ساخت را حذف می‌کرد. یک شبکه‌ی FMM تصادفی با یادگیری قوی معرفی شد [27]. بجای یک برچسب دسته، بردار احتمال در یک فرآیند اتوماسیون تصادفی برای تخمین اینکه کدام عمل مبتنی بر انتخاب تصادفی اتخاذ شود مورد استفاده قرار گرفت. به موجب موفقیت مدل‌های مبتنی بر FMM فوق الذکر، شبکه‌ی FMM خوشه‌بندی را بهبود می‌دهیم [17] (که از این به بعد به عنوان FMM شناخته می‌شود) به طوری که برای مدیریت کارهای خوشه‌بندی اطلاعات در این تحقیق بسیار کارآمد است. مفید بودن مدل FMM بهبودیافته را برای اجرای کاربرد نظارت بر کیفیت توان دنیای واقعی بیشتر تشریح می‌کنیم. در کل، FMM قادر است تا ارتباط بین خوشه‌ها و مجموعه‌های فازی را برقرار کند [17]. به علاوه، FMM تعدادی از معیارهای ساکن را برای برطرف کردن مشکلات خوشه‌بندی اطلاعات پردازش می‌کند، یعنی نیاز به تعداد از پیش تعیین شده‌ای از خوشه‌ها ندارد و تعداد خوشه‌ها را محدود نمی‌کند (یعنی بصورت افزایشی رشد می‌کند)؛ از طرفی یک فرآیند کارآمد و ساده را معرفی می‌کند و فقط یک پارامتر کلیدی دارد (یعنی اندازه‌ی هایپرباکس) که نیاز دارد تا توسط کاربران بصورت کاملاً دقیق و درست تنظیم شود [17]. الگوریتم‌های خوشه‌بندی معروف با فرآیندهای یادگیری دسته‌ای نظیر خوشه‌بندی میانگین- k و میانگین- c فازی نیازمند تعداد از پیش تعریف شده‌ای از خوشه‌ها هستند تا با آن‎ها شکل گیرند به طوری که برای مجموعه‌ای از اطلاعات در مقیاس بزرگ یا هنگامی که ساختار اطلاعات تغییرات اساسی را حفظ می‌کنند (مثلاً در محیط‌های غیر ساکن) می‌تواند کار مشکلی باشد. FMM قادر است تا این سختی را با تشکیل شبکه‌ای دینامیک برطرف کند. این شبکه قادر است تا تعداد خوشه‌ها را بصورت افزایشی و مبتنی بر مشخصات و ویژگی‌های نمونه‌های اطلاعات ورودی تولید کند. سهم اصلی این تحقیق دو چیز است: یک مدل FMM بهبودیافته (MFMM) برای برطرف کردن مشکلات مربوط به خوشه‌بندی اطلاعات و یک کاربرد دنیای حقیقی از MFMM برای نظارت بر کیفیت توان. نوآوری‌های کلیدی این تحقیق شامل تجهیز MFMM با یک فرآیند شکل دهی مرکزی در خوشه بندی برخط و اجازه‌ی تحلیل اعتبار خوشه و ارزیابی ساختار با استفاده از ضریب همبستگی cophenetic (CCC) می‌شود [28]. شبکه‌ی FMM اصلی مورد نظر Simpson [17] خوشه‌های اطلاعات را با استفاده از یک ساختار هایپرباکس تشکیل می‌دهد. حداقل و حداکثر رئوس هر هایپرباکس بصورت وزن‌های شبکه کدگذاری می‌شوند. به هرحال، هیچ اطلاعات مرکزی با توجه به نمونه‌های اطلاعات خوشه‌بندی شده در هر هایپرباکس در دسترس نیست. در نتیجه، در این تحقیق یک فرآیند تخمین مرکزی خوشه در FMM اصلی تلفیق می‌شود. برای اطمینان از این‌که مرکز‌ها در خلال مرحله‌ی یادگیری در یک هایپرباکس باقی مانده‌اند، مرکزها دائماً در هر تناوبِ به روز رسانی هایپرباکس بررسی می‌شوند. باید توجه شود که داشتن اطلاعات مرکزی خوشه در MFMM مفید است چون اجازه می‌دهد تا تحلیل اعتبار خوشه اجرا شود. در این تحقیق، معیار CCC وابسته به خوشه‌های تولید شده به عنوان یک اندازه‌ی کمی سازگار می‌شود، که به موجب آن مرکز‌ها برای ارزیابی ساختار استفاده می‌شوند. برای توضیح موثر بودن MFMM، یک مساله‌ی نظارت بر کیفیت توان اجرا می‌شود. کیفیت توان حالت مهمی از یک شبکه‌ی الکتریکی است و کیفیت توان ضعیف می‌تواند منجر به تلفات تجاری، بخصوص برای بخش‌های صنعتی شود [29]. بقیه‌ی مقاله بصورت زیر تنظیم شده است: مروری بر روش‌های مختلف خوشه‌بندی در کارهای قبلی، که به طور کلی شامل الگوریتم‌های خوشه‌بندی میانگین- c و میانگین- k می‌شود، با جزئیات کامل در بخش2 بررسی شده است. شبکه‌ی عصبی خوشه‌بندی FMM کلی و اصلاح و بهبود آن در بخش3 توضیح داده شده است. در بخش‌های 4 و 5 یک سری از آزمایش‌ها ارائه شده است. برای ارزیابی مفید بودن MFMM، در ابتدا تعدادی مجموعه اطلاعات معیار در بخش4 استفاده شده است و نتایج با نتایج گزارش شده در مراجع قبلی مقایسه شده است. سپس در بخش5 مجموعه‌ای از اطلاعات دنیای حقیقی از اندازه‌گیری‌های حقیقی مربوط به نظارت کیفیت توان مورد استفاده قرار گرفته است. نتایج ناشی از هر دو مساله‌ی معیار و دنیای واقعی تحلیل و بررسی می‌شوند. نتیجه‌گیری‌ها و پیشنهادات برای کارهای بعدی در بخش6 ارائه شده است.
پیش نمایش مقاله
پیش نمایش مقاله  یک شبکه‌ی عصبی حداقل- حداکثر فازی بهبودیافته برای خوشه‌بندی اطلاعات و کاربردهای آن برای نظارت کیفیت توان

چکیده انگلیسی

When no prior knowledge is available, clustering is a useful technique for categorizing data into meaningful groups or clusters. In this paper, a modified fuzzy min–max (MFMM) clustering neural network is proposed. Its efficacy for tackling power quality monitoring tasks is demonstrated. A literature review on various clustering techniques is first presented. To evaluate the proposed MFMM model, a performance comparison study using benchmark data sets pertaining to clustering problems is conducted. The results obtained are comparable with those reported in the literature. Then, a real-world case study on power quality monitoring tasks is performed. The results are compared with those from the fuzzy c-means and k-means clustering methods. The experimental outcome positively indicates the potential of MFMM in undertaking data clustering tasks and its applicability to the power systems domain.