داده کاوی، آمار، تحقیقات بازار

آموزش، مشاوره و اجرای پروژه های تحقیقاتی

آموزش، مشاوره و اجرای پروژه های تحقیقاتی

داده کاوی، آمار، تحقیقات بازار

۳ مطلب با کلمه‌ی کلیدی «طبقه بندی» ثبت شده است

تفاوت الگوریتمهای k نزدیکترین همسایگی و K-means

در پستهای قبلی در مورد تفاوت میان طبقه بندی و خوشه بندی بحث کردیم. در مورد سوال این پست نیز اولین پاسخی که می توان داد این است که الگوریتم K نزدیکترین همسایگی (KNN) یک الگوریتم طبقه بندی و الگوریتم k-means یک الگوریتم خوشه بندی است. منطق الگوریتم KNN به زبان ساده این است که اگر شما شبیه به همسایگانتان باشید، آنگاه شما یکی از آنها خواهید بود. یا اگر سیب شباهت بیشتری به موز، پرتقال و ملون (میوه) نسبت به یک میمون، گربه یا موش (حیوان) دارد، آنگاه به احتمال قوی سیب یک میوه است. در ادامه مثالی آورده شده است. فرض کنید سه کلاس داریم و هدف پیدا کردن کلاس مناسب یرای مثال ناشناخته xj است. بعبارت دیگر می خواهیم بدانیم برای مثال ناشناخته x ، کدام برچسب کلاس مناسبتر است. در این مورد  از فاصله اقلیدسی و k=5 همسایه استفاده کرده ایم. از میان 5 تا از نزدیکترین همسایه ها، 4 تا متعلق به w و یکی متعلق بهw است بنابراین x به w1 ، کلاس غالب، تخصیص داده خواهد شد.

در مورد K-means هم که شما باید با داشتن تعدادی داده، آنها را در K  خوشه، خوشه بندی کنید. روش K-means متعلق به خانواده الگوریتمهای مرکز متحرک است به این معنا که مرکز خوشه در هر تکرار به آهستگی به سمت مینیمم کردن تابع هدف پیشروی می کند. در شکل زیر شما با یک حدس اولیه برای میانگینهای خوشه های m و m شروع می کنید و از این میانگینها برای گروه بندی هدف هایتان استفاده می کنید، سپس میانگینها را بروز می کنید  و دوباره گروه بندی می کنید و این کار را تا جایی ادامه می دهید که میانگینهای m و m تغییر یا حرکت نکنند یا اینکه عملیات تکرار را تا دستیابی به یک حد آستانه (بعنوان مثال تعداد تکرارها) ادامه می دهید.

تفاوت خوشه بندی و طبقه بندی در داده کاوی

در پستهای قبلی با یادگیری با نظارت و بدون نظارت آشنا شدیم.

خوشه بندی یا Clustering از روشهای داده کاوی است که از یادگیری بدون نظارت استفاده می کند. در واقع خوشه بندی بدون داشتن یک مثال آموزشی و بدون هر گونه ناظر سعی در پیدا کردن شباهتهای موجود در داده ها دارد به گونه ای که موارد شبیه بهم در یک خوشه قرار می گیرند و موارد داخل دو خوشه متفاوت با هم تفاوت فاحشی دارند. شباهت بین دو مورد بر اساس فاصله اقلیدسی بین آن دو سنجیده می شود به گونه ای که هر چه فاصله بین دو شی کمتر باشد، شباهت بین دو مورد بیشتر و هر چه فاصله بین دو مورد از هم بیشتر باشد، شباهت کمتر است. 

مثال برای خوشه بندی، در نظر گرفتن جاندارن در دو خوشه پستاندار و خزنده است. در خوشه پستانداران، انسان، پلنگ، فیل، و غیره قرار می گیرند. از سوی دیگر، خوشه خزنده شامل مار، مارمولک، اژدها کامودو و غیره می شود.

طبقه بندی، فرایند دسته بندی داده ها به کمک برچسب کلاس هاست.در طبقه بندی یا Classification نیاز به داده های آموزشی هست در حالی که در خوشه بندی نیاز به یادگیری و داده های آموزشی نیست. 

به عنوان مثالی از طبقه بندی، فرم درخواست وام را در بانکها در نظر بگیرید. مشتریان تکمیل کننده این فرمها را می توان طبق سن و دستمزدشان، به عنوان مشتری بدون ریسک یا پرریسک دسته بندی نمود. به این نوع فعالیت، یادگیری تحت نظارت گفته می شود. مدل ساخته شده می تواند برای طبقه بندی داده های جدید مورد استفاده قرار گیرد. گام یادگیری می تواند با استفاده از مجموعه داده های آموزشی تعریف شده، اجرا شود. مدل تولیدی می تواند در قالب یک درخت تصمیم گیری یا مجموعه ای از قوانین باشد.

مرتضی علیاری

1397/1/27

یادگیری ماشین چیست و انواع آن کدامند؟

در این پست شما را با مبحث یادگیری ماشین یا Machine Learning که یکی از مباحث پایه علم هوش مصنوعی است آشنا خواهم کرد. 
مغز شما به صورت ناخود آگاه در طول روز بارها و بارها با استفاده از روش یادگیری ماشین در تمیز دادن چیزهای مختلف از یکدیگر به شما کمک می کند. فرض کنید در کودکی به شما گفته شده نام حیوانی با این شکل خاص و با این قد مثلا اسب است. از آن زمان تاکنون مغز شما به صورت کاملا دقیق تمام حیواناتی را که ویژگی هایی نزدیک به ویژگی های گفته شده را دارند به عنوان اسب می شناسد.
اسب
به عنوان مثالی دیگر فرض کنید تعدادی شکل هندسی به شما داده اند و نام آنها را به شما نگفته اند و از شما خواسته اند که آنها را در دسته های جدا قرار دهید. در اینجا کاری که مغز شما می کند به این صورت است که  ویژگی های مشابهی را در اشکال پیدا می کند و در نهایت اشکال شبیه به هم را در یک دسته قرار می دهد. 
یادگیری بدون ناظر
  در اینجا شما با دو گونه از یادگیری آشنا شدید که در ادامه توضیح داده ام:
نوع اول زمانی است که به شما الگویی مانند اسب را نشان می دهند و از آن پس مغز شما دیگر تمامی اسب ها را خواهد شناخت. به این نوع از یادگیری، یادگیری با ناظر یا Supervised Learning گفته می شود. 
در نوع دوم بدون اینکه آموزشی داده شود به شما تعدادی شکل داده می شود و  خواسته می شود که آنها را در دسته های جدا گانه قرار دهید. مغز شما اشکال را با استفاده از شباهت هایی که با هم دارند در دسته های مختلف دسته بندی می کند. به این نوع از یادگیری، یادگیری بدون ناظر یا Unsupervised Learning کفته می شود.
البته یادگیری ترکیبی نیز وجود دارد که در اینجا به آن پرداخته نشده است.
کامپیوترها نیز درست مشابه مغز انسان با استفاده از مثالهایی که به آنها ارائه می شود و یا با استفاده از ویژگی های مشترک اقدام به یادگیری می کنند که به این فرآیند یادگیری ماشین گفته می شود.
در پایان این پست، امیدوارم که این مطلب برای شما مفید بوده باشد. منتظر پست بعدی باشید که در مورد انواع تکنیکهای یادگیری ماشین خواهد بود.
مرتضی علیاری
98/01/21