پایان نامه مقطع کارشناسی ارشد رشته فناوری اطلاعات

وزارت علوم، تحقيقات و فناوري

دانشگاه علوم و فنون مازندران

پايان نامه مقطع كارشناسي ارشد

رشته: مهندسی فناوری اطلاعات

عنوان :

طراحی سیستم دسته‌بند فازي مبتنی بر بهینه سازي ازدحام ذرات براي تشخیص بیماري دیابت

استاد راهنما:

دکتر جواد وحیدی

استاد مشاور:

دکتر همایون موتمنی

برای رعایت حریم خصوصی نام نگارنده درج نمی گردد

تکه هایی از متن به عنوان نمونه :

فهرست رئوس مطالب:

فصل اول – مقدمه و کلیات پژوهش…………………. 1

1-1- مقدمه………………… 2

1-2- اظهار مسأله………………… 3

1-3- اهداف پژوهش…………………. 5

1-4- سوالات پژوهش…………………. 6

1-5- فرضیات مسأله………………… 6

1-6- نوآوری‌های پژوهش…………………. 7

1-7- تعریف واژگان………………… 7

1-8- ساختار پایان نامه………………… 8

فصل دوم – ادبیات و پیشینه پژوهش…………………. 10

2-1- مقدمه………………… 11

2-2- داده‌کاوی…………………. 11

2-3- دسته‌بندی…………………. 13

2-4- الگوریتم‌های رایج دسته‌بندی…………………. 15

2-4-1- شبکه‌های عصبی مصنوعی…………………. 15

2-4-2- درخت‌های تصمیم………………… 19

2-4-3- شبکه‌های بیزین…………………. 21

2-4-4- K نزدیک‌ترین همسایه………………… 23

2-4-5- ماشین بردار پشتیبان………………… 24

2-4-6- روش‌های مبتنی بر قانون………………… 28

2-5- الگوریتم بهینه‌سازی ازدحام ذرات………………….. 32

2-5-1- پارامترهاي پايه بهينه‌سازي ازدحام ذرات………………….. 35

2-5-2- چالش‌ها و مسائل پیش روی الگوریتم بهینه‌سازی ازدحام ذرات…….. 39

2-5-2-1- مشکل ابعاد بالا………………… 40

2-5-2-2- مشکل همبستگی میان داده‌ها ………………..43

2-5-3- گونه‌های مختلف PSO………………….

2-5-3-1- بهینه‌سازی ازدحام ذرات مبتنی بر شبکه‌های جمعی…………………. 48

2-5-3-1-1- همسایگی مبتنی بر فاصله فضایی…………………. 48

2-5-3-1-2- همسایگی فزاینده……………….. 48

2-5-3-1-3- بهینه‌سازی ازدحام ذرات کاملاً آگاه (FIPS)…………………

2-5-3-2- مدل پیوندی بهینه‌سازی ازدحام ذرات………………….. 50

2-5-3-3- بهینه‌سازی ازدحام ذرات چند جمعیتی…………………. 53

2-6- سیستم‌های فازی…………………. 56

2-6-1- ساختار یک سیستم دسته‌بندی مبتنی بر قوانین فازی……… 57

2-6-2- دسته‌بندی بدون بهره گیری از درجه قطعیت………………….. 58

2-6-3- دسته‌بندی با بهره گیری از درجه قطعیت………………….. 62

2-6-4- استنتاج فازی…………………. 66

2-7- معیار‌های ارزیابی دسته‌بند‌ها……………….. 68

فصل سوم – روش پژوهش…………………. 72

3-1- مقدمه………………… 73

3-2- تبدیل داده‌های حقیقی به ترم‌های فازی…………………. 75

3-3- تولید توابع عضویت و قوانین فازي با بهره گیری از الگوریتم بهینه‌سازی ازدحام ذرات…….. 77

3-3-1- کدگذاري توابع عضویت فازي…………………. 78

3-3-2- کدگذاري قوانین فازي…………………. 80

3-3-3- PSO پیشنهادی…………………. 82

3-3-5- توابع برازش کیفیت قوانین…………………. 87

3-5- نتیجه‌گیری…………………. 90

فصل چهارم – محاسبات و یافته‌های پژوهش…………………. 91

شما می توانید تکه های دیگری از این مطلب را در شماره بندی انتهای صفحه بخوانید              

4-1- داده‌های مورد بهره گیری……………….. 92

4-2- تنظیم پارامترها……………….. 94

4-3- روش‌های بهره گیری شده به مقصود مقایسه………………… 97

4-4- نتایج…………………. 98

4-5- نتیجه گیری…………………. 101

فصل پنجم – نتیجه گیری و پیشنهادات…………………. 102

5-1- اختصار و نتیجه‌ گیری…………………. 103

5-2- پیشنهادات………………….. 103

منابع:……………….. 105

چکیده:

تشخیص بیماري دیابت و یا آگاهی یافتن از احتمال بالاي ابتلا به این بیماري همواره کار آسانی نخواهد بود. زیرا که این بیماري علائم متعددي را بروز می‌دهد که بعضی از این علائم در سایر بیماری‌های دیگر نیز وجود دارند. پس پزشک براي اتخاذ یک تصمیم مناسب، بایستی نتیجه‌ی آزمایش‌های بیمار و تصمیم‌هایی که در گذشته براي بیماران با وضیعت مشابه گرفته می باشد، را مطالعه کند.

در این پایان نامه از یک الگوریتم دسته‌بندی مبتنی بر قانون براي دسته‌بندی بیماران دیابتی بهره گیری شده می باشد. براي استخراج قوانین فازي از یک الگوریتم بهینه سازي ازدحام ذرات بهره گیری شده می باشد. این الگوریتم داراي ویژگی‌هایی می باشد که آن را از سایر الگوریتم مورد بهره گیری متمایز می کند. مانند‌ی این ویژگی‌ها می‌توان به تابع افزایش تنوع ذرات و تکامل هم‌زمان توابع عضویت و قوانین فازي تصریح نمود. براي ارزیابی کارایی الگوریتم از مجموعه داده‌ی دیابت بهره گیری شده می باشد. نتایج ارزیابی‌ها نشان می‌دهد که الگوریتم براي مجموعه داده‌ی دیابت داراي کارایی بسیار بالایی می‌باشد. همچنین کارایی الگوریتم پیشنهادي به علت بالا بردن قابلیت تفسیرپذیري دسته‌بند (کاهش تعداد قوانین فازي) بسیار مناسب می‌باشد.

شما می توانید مطالب مشابه این مطلب را با جستجو در همین سایت بخوانید                     

فصل اول: مقدمه و کلیات پژوهش

1-1- مقدمه

افزایش بهره گیری از کامپیوترها در فعالیت‌های کسب و کار، منجر به رشد سریع پایگاه‌های اطلاعاتی و اجتماع داده‌ها توسط بیشتر سازمان‌ها شده می باشد. روزانه حجم عظیمی از داده‌ها تولید شده و در پایگاه‌های مختلف داده ذخیره می گردد. در سال‌های اخیر تمایل به جستجو برای کشف الگوهای تکرار‌پذیر به مقصود بهبود در تصمیم گیری افزایش چشمگیری داشته می باشد. همچنین کاوش در داده‌های تراکنشی جهت یافتن الگوهای پنهان و تکنیک‌های کشف دانش به مقصود شناخت دقیق‌تر و بیشتر تراکنش‌ها، اهمیت بسزایی یافته می باشد. [1]. در حوزه پزشکی و سلامت با افزایش بهره گیری از سیستم‌های جامع درمانی و پرونده‌های الکترونیک بیمار در بیمارستان‌ها و مراکز درمانی حجم انبوهی از اطلاعات مربوط بیماران و انواع بیماری‌ها مهیا می گردد. [2]. استخراج دانایی از حجم عظیم داده‌های مرتبط با سوابق بیماری و پرونده‌های پزشکی افراد با بهره گیری از فرآیند داده‌کاوی می‌تواند منجر به شناسایی قوانین حاکم بر ایجاد، رشد و افت بیماری‌ها گردیده و اطلاعات ارزشمندی را به مقصود شناسایی علل وقوع بیماری‌ها با در نظر داشتن عوامل محیطی حاکم در اختیار متخصصین و دست اندر کاران حوزه سلامت قرار دهد؛ که این امر در نهایت منجر به افزایش متوسط طول عمر افراد جامعه و ایجاد آرامش می گردد. [3].

آن چیز که مسلم می باشد با افزایش سیستم‌های الکترونیک سلامت حجم داده‌های پزشکی هر روزه در حال افزایش می باشد. اما این مجموعه داده‌های بزرگ به گونه خام هیچ کاربردی ندارد برای آنکه بتوان از این داده‌ها ارزشی را استخراج نمود نیاز به تحلیل داده‌ها و تبدیل آن به اطلاعات و دانش، یک نیاز اساسی می باشد. با در نظر داشتن چنین حجمی از داده‌ها بهره گیری از عامل انسانی به عنوان تشخیص دهنده الگوها و تحلیلگر داده‌ها پاسخگو نمی‌باشد؛ لذا داده کاوی روی داده‌های پزشکی از اهمیت بالایی برخوردار می باشد. داده‌کاوی را می‌توان از جنبه‌های مختلف در پیشگیری یا تشخیص انواع بیماری، انتخاب روش‌های درمان بیماری، مدت زمان بستری بیمار و … به کار برد.

2-1- اظهار مسأله

دیابت یکی از بیماری‌های رایج در جوامع امروزی می باشد که دارای عوارض خطرناکی می‌باشد. این بیماری اگر چه گونه‌ای از بیماری‌های قلبی محسوب نمی‌گردد اما اغلب سبب بیماری‌های قلبی می گردد.

تشخیص بیماری دیابت و یا آگاهی یافتن از احتمال بالای ابتلا به این بیماری همواره کار آسانی نخواهد بود. زیرا که این بیماری علائم متعددی را بروز می‌دهد که بعضی از این علائم در سایر بیماری‌ها نیز وجود دارند. پس پزشک برای اتخاذ یک تصمیم مناسب، بایستی نتیجه‌ی آزمایش‌های بیمار و تصمیم‌های که در گذشته برای بیماران با وضیعت مشابه گرفته می باشد، را مطالعه کند. با در نظر داشتن حجم انبوه تعداد بيماران، مي‌توان از يك ابزار داده‌كاوي براي شناخت الگوي بيماران قبلي بهره گیری كرد.

در اين پايان‌نامه با در نظر داشتن ماهیت مسأله از يك الگوريتم دسته‌بندي برای تشخیص بیماری دیابت بهره گیری می‌کنیم سپس آن‌را با سایر روش‌ها ارائه شده مقایسه می‌کنیم. روش دسته بندی یک روش یادگیری با نظارت می باشد که داده‌های ورودی به دو بخش داده‌های آموزش و داده‌های آزمون تقسیم می شوند. هر الگوریتم کاندید، آغاز با بهره گیری از مجموعه داده آموزش یک مدل را که نشان دهنده الگوی حاکم بر داده‌ها می‌باشد را استخراج می کند و سپس با بهره گیری از مجموعه آزمون دقت مدل ارائه شده برای دسته‌بندی را مطالعه می کند.

الگوریتم‌های متعددی برای دسته بندی ارائه شده‌اند که از آن دسته می‌توان؛ به شبکه‌های بیزین [4]، روش‌های مبتنی بر درخت [5]، الگوریتم ماشین بردار پشتیبان [6]، روش‌های مبتنی بر مجموعه فازی [7]، الگوریتم‌های فرا اکتشافی [8] و شبکه‌های عصبی [9] تصریح نمود.

در این نوشتار قصد داریم برای استخراج قوانين فازي از يك الگوريتم آموزش دیده مبتنی بر هوش جمعی، بهینه‌سازی ازدحام ذرات (PSO) بهره گیری کنیم. خاصیت اصلی الگوریتم‌های هوش جمعی تبادل اطلاعات بین ذرات می باشد که در یافتن حالت بهینه بسیار موثر می‌باشند.

کوشش شده با در نظر گرفتن نقاط ضعف و قوت روش‌های مختلف داده کاوی یک الگوریتم ترکیبی برای تشخیص بیماری ارائه گردد. الگوریتم شبکه عصبی معمولاً نرخ دسته بندی مناسبی را ارائه می‌دهد اما از شفافیت لازم برخوردار نیست. پس نمی‌توان این اطلاعات را توسط سیستم‌های خبره مطالعه نمود. برای حل این مسئله بایستی یک ارائه قابل فهم انسانی از دسته‌بندی ایجاد نمود. این هدف می‌تواند با استخراج قوانین فازی تولید شده که برای کاربر قابل فهم می باشد بدست بیاید.

دو معیار اصلی برای برازش الگوریتم‌های دسته‌بندی؛ نرخ دسته بندی و قابلیت تفسیر می‌باشد. نرخ دسته بندی میزان دقت کار الگوریتم در دسته بندی نمونه‌های آزمون را نشان می‌دهد و قابلیت تفسیر به معنی میزان سادگی و قابلیت توسعه روش دسته بندی می‌باشد.

در سال‌های اخیر قوانین فازی از آن جهت که هم دقت مناسبی دارند وهم قابلیت تفسیر مناسبی را ارائه می‌دهند بیشتر مورد توجه قرار گرفته‌اند. یک الگوریتم فازی از آن جهت مورد توجه می‌باشد که شامل مجموعه‌ای از قوانین اگر-آنگاه فازی می گردد که تفسیر آن‌ها توسط بشر خبره امکان پذیر می باشد. مسئله اساسی در چنین سیستم‌هایی انتخاب مجموعه‌ای از قوانین فازی بهینه می باشد؛ لذا این مسئله را می‌توان نوعی از بهینه سازی ترکیبی در نظر گرفت که با رشد ابعاد مسئله دسته بندی، تعداد جواب‌های بهینه محلی نیز به صورت نمایی افزایش می‌یابد و الگوریتم کاندید برای حل آن بایستی مجموعه‌ای از جواب‌های بهینه یا نزدیک به بهینه را ارائه دهد [10].

روش‌های مختلفی برای استخراج قوانین از مجموعه داده هست ازجمله آن‌ها می‌توان به روش‌های مبتنی بر شبکه‌های عصبی [11] و روش‌های مبتنی بر خوشه‌بندی [12] تصریح نمود. با در نظر داشتن قابلیت‌های روش‌های فرا اکتشافی برای پوشش فضای جستجو، این الگوریتم‌ها برای استخراج قوانین می‌توانند یک گزینه مناسب باشند. این روش‌ها با ایجاد یک راه حل اولیه در فضای جستجو آغاز می شوند و سپس به وسیله یک مجموعه قواعد جستجوی بهینه شروع می گردد. در هر مرحله از الگوریتم جستجو همواره یک راه حل یا یک مجموعه از راه حل‌ها وجود دارند که وضعیت فعلی الگوریتم را نشان می‌دهند. بعضی از روش‌های اکتشافی، روش‌های راه حل به راه حل هستند یعنی در فضای جستجوی مسئله از طریق یک راه حل به راه حل دیگر دست می‌یابند. بقیه روش‌ها بر پایه مجموعه می‌باشند که با اعمال تغییراتی در مجموعه فعلی به مجموعه جدید می‌رسیم. برای بهره گیری از روش‌های مکاشفه‌ای در برنامه‌های داده کاوی بایستی آن‌ها را با یک روش محلی ادغام کنیم. این روش‌های محلی، استراتژی کلی روش‌های مکاشفه‌ای را هدایت می‌کنند.

3-1- اهداف پژوهش

هدف از روش ارائه شده کشف الگوها در میان مجموعه داده بیماران دیابتی برای کمک به پزشکان در تصمیم گیری می‌باشد رسیدن به نرخ دسته بندی و قابلیت تفسیر مطلوب از مجموعه داده با ترکیب مفهوم فازی و الگوریتم هوش جمعی بهینه‌سازی ازدحام ذرات برای استخراج قوانین فازی بدست می‌آید.

***ممکن می باشد هنگام انتقال از فایل اصلی به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود اما در فایل دانلودی همه چیز مرتب و کامل و با فرمت ورد موجود می باشد***

متن کامل را می توانید دانلود نمائید

زیرا فقط تکه هایی از متن پایان نامه در این صفحه درج شده (به گونه نمونه)

اما در فایل دانلودی متن کامل پایان نامه

 با فرمت ورد word که قابل ویرایش و کپی کردن می باشند

موجود می باشد

تعداد صفحه : 124

قیمت : چهارده هزار و هفتصد تومان