۱۴ فیلد مورد نظر در جدول ۴-۱ آورده شده و با توجه به اظهارنظر مشتریان و داده های مربوط به آمار سایت در مقیاس ۱ تا ۵ با توجه به درجه اهمیت بسیارکم، کم، متوسط، زیاد و خیلی زیاد رتبه بندی شده است.
جدول ۴-۱- فیلدهای مورد سنجش
نام فیلد ها
سهولت استفاده از سایت
تنوع روش های فروش
قابل درک بودن ظاهر و محتوای سایت
تنوع روش های پرداخت
استقرار مناسب اطلاعات
رضایت و خرسندی از تعامل با سایت
ترتیب مناسب قرارگیری صفحات
دسترسی به سایت به صورت ۲۴/۷
اطلاع رسانی مناسب در مورد محصولات و خدمات
امنیت و حفظ حریم شخصی
به روز بودن اطلاعات سایت
انجام کارآمد فعالیت های مورد نظر
تنوع محصولات یا خدمات
پاسخگویی و رفع مشکلات احتمالی
۴-۴- انتخاب نرم افزار
نرم افزارهای داده کاوی به منظور تحلیل و طبقه بندی داده ها و شناسایی روابط میان داده ها مورد استفاده قرار میگیرد. در این پایان نامه از نرم افزار کلمنتاین[۲۵] نسخه ۱۲ محصول شرکت SPSS استفاده شده است. صفحه اول این نرم افزار در شکل ۴-۱ قابل مشاهده است.
شکل ۴-۱- صفحه اول نرم افزار کلمنتاین نسخه ۱۲
نرم افزار کلمنتاین یکی از نرم افزارهای پیشرو در علم داده کاوی است که دارای ویژگی های بسیار مثبتی میباشد که کاربران را جذب خود کردهاست. از جمله این ویژگی ها می توان به طراحی واسط کاربر آن اشاره کرد که باعث می شود، کاربران به راحتی بتوانند با این نرم افزار ارتباط برقرار کرده و مدل های مورد نظر خود را از طریق آن بسازند. از سوی دیگر برای افرادی که برنامه نویسی نمی دانند نیز قابل استفاده میباشد زیرا برای مدلسازی نیازی به برنامه نویسی نمی باشد. از دیگر قابلیت های این نرم افزار استفاده از انواع داده به عنوان داده ورودی مثل پایگاه های داده رابطه ای، داده های متنی، صفحاتHTML ، صفحات گسترده و … ، اتصال به سیستم های اطلاعاتی موجود سازمان، مدل سازی تکنیک های مطرح داده کاوی مانند روش های دسته بندی و پیشبینی، روش های خوشه بندی، درخت های تصمیم، شبکه های عصبی، الگوریتم های تشخیص آنومالی، مدل های تشخیص قواعد وابستگی، سری های زمانی و تعریف انواع خروجی ها و گزارشات پیشرفته بصری و پشتیبانی از متدولوژی CRISP-DM میباشد [علیزاده و ملک محمدی ۱۳۹۲].
متدولوژی CRISP-DMیک مدل فرایند داده کاوی است که شامل شش مرحله تعریف مسئله، جمع آوری و فهم داده ها، آماده سازی داده ها، مدل سازی، ارزیابی و توسعه میباشد .
۴-۵- تکنیک های مورد استفاده
برای ارزیابی فاکتورهای مؤثر در سنجش کارایی سایت، از مدل های درخت تصمیم [۲۶]C&R، [۲۷]CHAID، [۲۸]QUEST و C5، روش خوشه بندی K-Means و تکنیک [۲۹]GRI که از قوانین انجمنی میباشد؛ استفاده شده است که ابتدا شرح مختصری از هر تکنیک بیان شده و در ادامه نتایج به دست آمده از هر الگوریتم توصیف میگردد.
۴-۵-۱- مدل های درخت تصمیم
مدل های درخت تصمیم که برای پیشبینی و دسته بندی مورد استفاده قرار می گیرند. مدل C&R، ناخالصی در هر دسته را به کمترین مقدار می رساند و تمامی تقسیم بندی ها به صورت دودویی میباشد. تکنیک CHAID، میتوانند در برخی موارد درختی را تولید کنند که به صورت غیر دودویی عمل کند یعنی یک گروه به سه یا بیشتر زیر گروه شکسته شود. مدل QUEST، همانند C&R عمل میکند اما زمان لازم برای ساخت درخت تصمیم را کاهش میدهد. تکنیک C5، بر حسب نیاز میتواند برای برخی از گره ها بیش از دو زیر گروه ایجاد کند [علیزاده و ملک محمدی ۱۳۹۲].
۴-۵-۱-۱- مدل C&R
شکل ۴-۲ ترتیب اولویت فیلدها را نشان میدهد که به عنوان فیلدهای ورودی برای سنجش کارایی سایت استفاده شده اند. طبق شکل، قابل درک بودن ظاهر و محتوای سایت، دسترسی به سایت به صورت ۲۴/۷ و سهولت استفاده از سایت به ترتیب از اهمیت بیشتری برخوردار است و سایر موارد اولویت یکسانی دارند.
شکل ۴-۲- اولویت بندی فیلدهای منتخب توسط الگوریتم C&R
با توجه به شکل ۴-۳ که نمودار درختی الگوریتم C&R میباشد، اگر فیلد دسترسی به سایت به صورت ۲۴/۷، مقدار ۴ یا ۵ را داشته باشد، کارایی سایت ۱۰۰ درصد است در غیر این صورت فیلد قابل درک بودن ظاهر و محتوای سایت بررسی می شود که در صورتی سایت کارایی دارد که فیلد بعدی یعنی سهولت استفاده از سایت مقدار ۴ را داشته باشد، اگر دو فیلد ذکر شده درجه ۱ تا ۳ را داشته باشد، کارایی سایت تضمین نمی شود. عدد n تعداد مواقعی که مقدار این فیلد در مجموعه داده صفر یا یک شده است را نشان میدهد و درصد های هر گره، درصد وقوع این حالت را در مجموعه داده مشخص میکند.
شکل ۴-۳- درخت C&R
۴-۵-۱-۲- مدل CHAID
با توجه به شکل ۴-۴، دسترسی به سایت به صورت ۲۴/۷، قابل درک بودن ظاهر و محتوای سایت و سهولت استفاده از سایت به ترتیب از اهمیت بیشتری برخوردار است.
شکل ۴-۴- اولویت بندی فیلدهای منتخب توسط الگوریتم CHAID
نمودار درختی مدل CHAID در شکل ۴-۵ نمایش داده شده است، بر اساس این نمودار قوانین اگر-آنگاه به صورت زیر بیان میگردد:
اگر فیلد دسترسی به سایت به صورت ۲۴/۷، مقدار ۴ یا ۵ را داشته باشد، کارایی سایت ۱۰۰ درصد میباشد و اگر ۱یا ۲ باشد، ۱۰۰ درصد ناکارآمد است.
اگر فیلد دسترسی به سایت به صورت ۲۴/۷ برابر با ۳ باشد، فیلد قابل درک بودن ظاهر و محتوای سایت بررسی می شود که در صورتی سایت کارایی دارد که فیلد بعدی یعنی سهولت استفاده از سایت مقدار ۴ را داشته باشد.
در مورد فیلد قابل درک بودن ظاهر و محتوای سایت و فیلد سهولت استفاده از سایت، مقدار ۴ کارایی و مقدار ۲ و ۳ عدم کارایی را نشان میدهد.
شکل ۴-۵- درخت CHAID
۴-۵-۱-۳- مدل QUEST
بر اساس شکل ۴-۶، قابل درک بودن ظاهر و محتوای سایت، دسترسی به سایت به صورت ۲۴/۷ و سهولت استفاده از سایت به ترتیب از اهمیت بیشتری برخوردار است و سایر موارد اولویت یکسانی دارند.
شکل ۴-۶- اولویت بندی فیلدهای منتخب توسط الگوریتم QUEST
با توجه به شکل ۷-۴ قوانین اگر- آنگاه از درخت حاصل از الگوریتم QUEST به صورت زیر است:
اگر فیلد قابل درک بودن ظاهر و محتوای سایت، ، مقدار ۴ یا ۵ را داشته باشد، سایت ۱۰۰ درصد کارایی دارد، در غیر این صورت فیلد بعدی یعنی دسترسی به سایت به صورت ۲۴/۷ بررسی می شود، اگر این فیلد ۴ یا ۵ باشد؛ سایت کارایی دارد و اگر برابر با ۱، ۲ یا ۳ باشد، در صورتی سایت کارآمد است که فیلد بعدی یعنی سهولت استفاده از سایت مقدار ۴ را داشته باشد.
به صورت خلاصه اگر دو فیلد دسترسی به سایت به صورت ۲۴/۷ و سهولت استفاده از سایت، درجه ۱ تا ۳ را داشته باشد، سایت کارایی ندارد.
شکل ۷-۴- درخت QUEST
۴-۵-۱-۴- مدل C5
در مدل C5 با توجه به شکل ۴-۸ فقط دو فیلد قابل درک بودن ظاهر و محتوای سایت، دسترسی به سایت به صورت ۲۴/۷ حائز اهمیت میباشد.
شکل ۴-۸- اولویت بندی فیلدهای منتخب توسط الگوریتم C5
آخرین نظرات