۱

 

x2

 

 

 

۱

 

۱

 

۱

 

۲

 

x3

 

 

 

۲

 

۱

 

۲

 

۲

 

x4

 

 

 

۳

 

۳

 

۳

 

۳

 

x5

 

 

 

۳

 

۳

 

۴

 

۳

 

x6

 

 

 

خوشه‏بندی نهایی نیز به عنوان نتیجه در سمت راست ترین ستون جدول ۱-۱ آورده شده است. همانطور که در جدول نیز مشخص است شماره خوشه‏ای که هر داده در خوشه‏بندی نهایی در آن قرار می‏گیرد مطابق با شماره خوشه اکثریت در خوشه‏بندی‏های اولیه می‏باشد. در این مثال، خوشه‏بندی توافقی با بهره گرفتن از رأی گیری بدست می‏آید.
خوشه‏بندی توافقی نیز مانند دیگر روش‏های خوشه‏بندی، یک مسئله بهینه سازی محسوب می‏شود به طوری که می‏خواهیم تعداد عدم توافق‏ها کمینه شود. همچنین لازم به ذکر است که مسائل خوشه‏بندی از نوع مسائل NP-کامل[۳۷] هستند.
یکی از کاربردهای خوشه‏بندی توافقی زمانی است که داده‏های اصلی جهت انجام خوشه‏بندی در دسترس نمی‏باشند، اما خوشه‏بندی‏ های مجزایی از داده‏های اصلی وجود دارد. این شرایط زمانی رخ می‏دهد که [۲]:
داده‏ها در منابعی اختصاصی قرار دارند و صاحبان داده نتایج خوشه‏بندی را ارائه داده اند اما داده‏های اصلی در اختیار خودشان است.
داده‏های اصلی مفقود و یا دور انداخته شده اند، اما خوشه‏های داده‏ای وجود دارند.
تمام داده‏های اصلی در دسترس هستند، اما ممکن است برای ذخیره شدن در یک سایت محاسباتی، بسیار بزرگ باشند. در این حالت ساختن خوشه‏بندی‏های مجزا از قسمت‏های مختلف داده و سپس ترکیب آنها می‏تواند روش مناسبی باشد.
دانلود پایان نامه - مقاله - پروژه
چنانچه بخواهیم دانشی جدیدی را به سیستم یادگیری وارد کنیم و یا از اطلاعات قبلی استفاده مجدد نماییم، می‏توانیم خوشه‏بندی‏های جدید را بدون نیاز به دانستن اطلاعاتی که برای خوشه‏بندی‏های قبلی استفاده شده است و یا چگونگی ایجاد آنها، با خوشه‏بندی‏های قبلی ترکیب کنیم.
الگوریتم‏های خوشه‏بندی توافقی دارای مزایایی بیش از دیگر الگوریتم‏های خوشه‏بندی می‏باشند. این الگوریتم‏ها اغلب : خوشه بندی بهتری تولید می‏کنند؛ خوشه بندی ترکیب شده‏ای را می‏یابند که به تنهایی توسط هر الگوریتم خوشه بندی دیگری قابل تولید نمی‏باشد؛ حساسیت کمتری نسبت به نویز دارند؛ و قادر به یکپارچه سازی نتایج از منابع توزیع شده می‏باشند [۵۷]. همچنین روش‏های خوشه‏بندی توافقی کاربردهای مختلفی در مسائل گوناگون مرتبط با خوشه‏بندی دارند: ۱) خوشه‏بندی داده‏های اسمی[۳۸] و مدیریت مقادیر ناقص[۳۹] در خوشه‏بندی، ۲) خوشه‏بندی داده‎های ناهمگن[۴۰]، در حالتی که چندتایی‏ها دارای صفات خاصه‏ای هستند که قابل مقایسه نمی‏باشند، ۳) تشخیص تعداد مناسب خوشه‏ها و همچنین تشخیص داده‏های دور افتاده، ۴) فراهم نمودن روشی جهت افزایش کیفیت خوشه‏بندی با بهره گرفتن از ترکیب نتایج چند الگوریتم خوشه‏بندی و ۵) خوشه‏بندی داده‏هایی که به صورت توزیع شده اند[۲۳].
چگونگی تولید خوشه‏بندی‏های اولیه و همچنین روش‏های ترکیب آنها در شکل ۳-۱ نشان داده شده است. جهت تولید خوشه‏بندی‏های اولیه از یک مجموعه داده‏ای مشخص می‏توان: الگوریتم‏های خوشه‏بندی مختلفی را بر روی داده‏ها اعمال نمود؛ یک الگوریتم را چندین بار با پارامترهای اولیه متفاوت بکار برد؛ و یا داده‏ها را به صورت افقی (سطرها) و یا عمودی (ستون‏ها) به قسمت‏های مختلف تقسیم کرده و سپس هر قسمت را خوشه‏بندی نمود. برخی از روش‏های ترکیب خوشه‏بندی‏های اولیه نیز عبارتند از: روش‏های همبستگی[۴۱]، روش رأی گیری، روش‏های تئوری اطلاعات و مدل ترکیبی [۵۳].
شکل ۱-۳ رویکردهای مختلف ترکیب خوشه‏بندی‏ها؛ سمت چپ: روش‏های تولید خوشه‏بندی‏های اولیه؛ سمت راست: روش‏های ترکیب خوشه‏بندی‏های اولیه و یافتن یک خوشه‏بندی نهایی [۱۵].
الگوریتم‏های مختلف
مقداردهی‏های اولیه متفاوت برای یک الگوریتم
زیر مجموعه‏های مختلف از اشیاء داده‏ای
زیر مجموعه‏های مختلف از صفات خاصه
همبستگی
رأی گیری
تئوری اطلاعات

موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...