دسته بندی ، طبقه بندی ، کلاس بندی Classification

دسته بندی یا Classification چیست؟

دسته بندی یا Classification یک از شاخه های علوم داده یا Data Science می باشد. که در بحث پیش بینی آینده predicting the future با استفاده از تجزیه و تحلیل داده ها است. دسته بندی با نام های دیگری همچون طبقه بندی ، کلاس بندی و Classification نیز شناخته می شود. طبقه بندی یک کار علمی داده ها برای پیش بینی مقدار متغیر طبقه بندی شده (هدف یا کلاس) با ساختن یک مدل بر اساس یک یا چند متغیر عددی و / یا دسته ای (پیش بینی کننده یا ویژگی) است.

طبقه‌ بندی (classification)

همواره در زندگی ما، مواردی وجود دارند که دوست داریم بدانیم اگر یک کاری را انجام دهیم نتیجه‌ی خوب یا بدی دارد؟ این کار رو چگونه انجام خواهیم داد؟ اگر بخواهیم بر اساس تجارب خودمان عمل کنیم نیاز داریم بر اساس کارهایی که قبلا انجام دادیم، و تجاربی که کسب کردیم ( یک فرآیند یادگیری رخ داده است)، برای شرایط جدید تصمیم گیری نماییم. این پارگراف بیان ساده ای از یادگیری ماشین را بیان می‌کند که تعریف دقیق و علمی آن به صورت زیر است:

طبقه‌ بندی (classification) علمی است که بر اساس داده‌های قبلی که دارای برچسب هستند، مدلی برای پیش بینی برچسب داده‌های جدید می‌سازد.

طبقه‌ بندی classification یکی از زیر شاخه‌ های اساسی یادگیری ماشین و داده کاوی است. و اساس آن داده‌های جمع‌‌آوری شده از اعمال گذشته هستند. اعمالی که بر اساس دانش فرد خبره برچسب گذاری شدند. برای اینکه یک مدل طبقه‌ بند خوب داشته باشیم، باید با داده‌ها و ساختار آنها و نیز تعداد دسته‌ها (برچسب-کلاس-طبقه‌) اطلاع داشته باشیم. هر چند آشنایی با ساختار و نوع داده‌ها گاها عملی غیر ممکن است اما در صورت وجود یک آشنایی ساده گاها نیز می‌توان مدل طبقه بند درست را انتخاب کرد.

برای درک مفهوم طبقه‌ بندی classification یک بار دیگر پارگراف اول را بخوانید. به بیان دیگر؛ طبقه‌ بندی classification فرآیند قرار داده نمونه‌های جدید در طبقات مختلف بر اساس داده‌های قدیمی است و برای این‌کار به یک مدل طبقه‌بند یا الگوریتم طبقه‌بند نیاز است.

گروه های اصلی الگوریتم های دسته بندی

چهار گروه اصلی الگوریتم های طبقه بندی عبارتند از:

1- جدول فراوانی Frequency Table

2- ماتریس کواریانس Covariance Matrix

  • Linear Discriminant Analysis
  • Logistic Regression

3- توابع تشابه Similarity Functions

4- سایر موارد

  • Artificial Neural Network
  • Support Vector Machine

 

 

مطالب زیر را حتما بخوانید