دسته بندی OneR

دسته بندی OneR یکی از روش های دسته بندی یا classification در زیر شاخه گروه جدول فراوانی Frequency Table در بحث پیش بینی آینده predicting the future در علوم داده یا داده کاوی است. در ادامه به توضیح و تشریح این الگوریتم همراه با یک مثال خواهیم پرداخت. دسته بندی OneR چیست؟ OneR ، مختصر "One Rule" ، یک الگوریتم طبقه بندی ساده اما در عین حال دقیق است که برای هر پیش بینی کننده در داده ها یک قانون ایجاد می کند ، سپس این قانون را با کوچکترین خطای کل به عنوان "یک قاعده" آن انتخاب می کند. برای ایجاد یک قانون برای یک پیش...
ادامه مطلب

دسته بندی ZeroR

دسته بندی ZeroR چیست؟ دسته بندی ZeroR یکی از روش های دسته بندی یا classification در زیر شاخه گروه جدول فراوانی Frequency Table در بحث پیش بینی آینده predicting the future در علوم داده یا داده کاوی است. روش ZeroR ساده ترین روش طبقه بندی است که به هدف متکی است و همه پیش بینی کننده ها را نادیده می گیرد. طبقه بندی ZeroR به راحتی طبقه بندی اکثریت (کلاس) را پیش بینی می کند. اگرچه هیچ قدرت پیش بینی در ZeroR وجود ندارد ، اما برای تعیین عملکرد پایه به عنوان معیار سایر روش های طبقه بندی مفید است. الگوریتم ZeroR یک جدول فرکانس...
ادامه مطلب

دسته بندی ، طبقه بندی ، کلاس بندی Classification

دسته بندی یا Classification چیست؟ دسته بندی یا Classification یک از شاخه های علوم داده یا Data Science می باشد. که در بحث پیش بینی آینده predicting the future با استفاده از تجزیه و تحلیل داده ها است. دسته بندی با نام های دیگری همچون طبقه بندی ، کلاس بندی و Classification نیز شناخته می شود. طبقه بندی یک کار علمی داده ها برای پیش بینی مقدار متغیر طبقه بندی شده (هدف یا کلاس) با ساختن یک مدل بر اساس یک یا چند متغیر عددی و / یا دسته ای (پیش بینی کننده یا ویژگی) است. طبقه‌ بندی (classification) همواره در زندگی ما، مواردی وجود...
ادامه مطلب

علوم داده Data Science

علوم داده Data Science چیست؟ علوم داده Data Science که با نام داده کاوی Data Mining نیز شناخته می شود در مورد توضیح گذشته explaining the past و پیش بینی آینده predicting the future با استفاده از تجزیه و تحلیل داده ها است. علم داده یک رشته چند رشته ای است که ترکیبی از آمار ، یادگیری ماشین ، هوش مصنوعی و فناوری پایگاه داده است. ارزش برنامه های علوم داده غالباً بسیار بالا تخمین زده می شود. بسیاری از مشاغل در طی سال های کار مقدار زیادی از داده ها را ذخیره کرده اند ، و علم داده قادر است دانش بسیار ارزشمندی را از این...
ادامه مطلب

الگوریتم نیوبیزین

روش نیوبیزین تئوری بیزین توسط توماس بیز در سال (1702-1761) پیشنهاد شد. قضیه بیزین یک روش از محاسبات احتمالی است و احتمال رخدادی که در آینده رخ خواهد داد وابسته به رخدادی است که قبلا رخ داده است. این تئوری توانایی خود یادگیری در سیستم هوشمند دارد که به‌صورت گسترده استفاده می‌شود. از تئوری بیزین می‌توان برای پیش‌بینی حوادث آینده بر اساس حوادث حاضر طبق نظریه‌ی آمار و احتمال استفاده کرد. دسته بندی نیوبیزین بر پایه قضیه Bayes و فرضیه های استقلال بین پیش بینی کننده ها است. یک مدل...
ادامه مطلب

الگوریتم یادگیری ماشین K-Means

خوشه بندی یکی از روش های یادگیری بدون نظارت است و هدف آن تقسیم بندی داده ها به خوشه های مختلف است به طوری که داده های درون یک خوشه بیشترین شباهت به یکدیگر را داشته باشند و از طرف دیگر داده های قرار گرفته در خوشه های مختلف بیشترین تفاوت را داشته باشند. خوشه بندی روشی است که هم در داده کاوی و هم در بینایی ماشین کاربرد دارد. از روش های رایج خوشه بندی می توان به خوشه بندی با الگوریتم K-means اشاره کرد. الگوریتم خوشه بندی K-means الگوریتم K-means یکی از روش های خوشه بندی ساده و سریع است. این...
ادامه مطلب