الگوریتم‌ یادگیری ماشین SVM چیست

svm.jpg

در بخش قبلی کلیاتی درباره‌ی یادگیری ماشین، انواع و کاربردهای آن توضیح دادیم. در این آموزش اما قصد داریم یکی از الگوریتم مهم و ضروری در این حوزه با نام SVM را به شما معرفی کنیم. با معرفی معروف‌ترین الگوریتم‌های یادگیری ماشین، همراه فیسیت باشید.

در بخش قبلی کلیاتی درباره‌ی یادگیری ماشین، انواع و کاربردهای آن توضیح دادیم. در این آموزش اما قصد داریم یکی از الگوریتم مهم و ضروری در این حوزه با نام SVM را به شما معرفی کنیم. با معرفی معروف‌ترین الگوریتم‌های یادگیری ماشین، همراه فیسیت باشید.

الگوریتم‌ یادگیری ماشین SVM و کاربردهای آن

این الگوریتم در اصل یکی از مدل‌های یادگیری نظارت شده است، به این معنا که به مجموعه‌ای از داده‌های از قبل برچسب گذاری نیاز داریم. SVM یکی از روش‌های تقریباً جدید است که در سال‌های اخیر روی کار آمده و نسبت به روش‌ها قدیمی‌تر، عملکرد بهتری از خود نشان داده است. این الگوریتم یادگیری ماشین جزء الگوریتم‌های تشخیص الگو دسته‌بندی می‌شود که در هر دو مورد کلاسیفیکیشن و رگرسیون کاربرد دارد اما بیشتر دز مسائل کلاسیفیکیشن از آن استفاده می‌شوند. این الگوریتم در مواردی مانند سیستم آنالیز ریسک، سیستم راهنمایی اتوماتیک اتومبیل، آنالیز بازار، پیشنهاد پروژه، مدیریت و برنامه‌ریزی، سیستم‌های مسیریابی، کلاسه بندی نمودارهای مشتری/بازار و... کاربرد دارد.

توضیح الگوریتم SVM با یک مثال

بگذارید همه چیز را با یک مثال پیش ببریم. فرض کنید فیسیت یک وب سایت با خدمات مختلف است که سرویس‌های مختلفی را ارائه می‌دهد و دائماً ایمیل‌های متفاوتی را درباره‌ی پیگیری سرویس‌ها، اطلاع از طرح‌های جدید و... ردیافت می‌کند. فرض کنید در یک برحه‌ی زمانی برای ما مهم است که تبلیغات بیشتری را دریافت کنید و از این رو نیاز داریم تا با سرعت بالا، ایمیلی که برای سفارش سرویس و یا تبلیغات ارسال شده‌اند را شناسایی کنیم. شاید اولین راه حلی که به ذهنمان بیاید، پیدا کردن برخی کلماتی است که ممکن است در ایمیل‌هایی با این مزمون استفاده می‌شوند. پیدا کردن این کلمات مشکل و زمانبر است و ممکن است نتوانیم تمامی کلماتی که نیاز است را پیدا کنیم.

در مقابل روش بهتری وجود دارد و آن یادگیری ماشین است. اگر از الگوریتم SVM استفاده کنیم، در مرحله‌ی اول به تعدادی ایمیل نیاز داریم که هر چه تعدادشان بیشتر باشد، بهتر است. برچسب گذاری کردن این ایمیل‌های اولیه، اولین گامی است که باید برداریم. کافی است آن‌ها را بررسی کرده و در یکی از دسته‌های تبلیغاتی و غیرتبلیغاتی قرار دهیم.

در مثال ما که داده‌ها ساده هستند و در دو دسته‌ قرار می‌گیرند، SVM یک مدل خطی را یاد می‌گیرد. درواقع SVM یک خط را ایجاد می‌کند که ایمیل‌ها را به دو دسته تقسیم می‌کند. یافتن همین خط، خودش مسئله‌ی مهمی در این روش است.

الگوریتم یادگیری ماشین SVM در واقعیت

برای استفاده از این الگوریتم، در ابتدا باید داده‌ها در یک فضای n بعدی مدل کنیم که n تعداد ویژگی‌هایی است که از داده‌ها داریم. حالا باید خط (یا به عبارت دیگر یک ابرصفحه) را پیدا کنیم که به بهترین شکل، داده‌ها را از هم جدا کند.

سناریو اول.jpg
سناریوی اول -

بیایید چند تصویر زیر را بررسی کنیم و نحوه‌ی انتخاب خط مناسب را تحلیل کنیم. در شکل اول، دو خط A و C داده‌ها را به درستی تقسیم بندی نمی‌کنند و این خط B است که تقسیم بندی درستی دارد.

سناریو دوم.jpg
سناریوی دوم -

در تصویر دوم اما سه خط A و B و C، تقسیم بندی درستی انجام می‌دهند. از بین این خطوط کدامیک انتخاب بهتری است؟ بدون شک خط C بهترین انتخاب است زیرا فاصله‌ی این خط تا نقاط حاشیه‌ای هر دسته بندی، حداکثری است. درواقع در صورتی که خطی را انتخاب کنیم که این فاصله‌ی حداکثری را نداشته باشد، ممکن است در طبقه بندی داده‌ها، دچار اشتباه شود.

سناریو سوم.jpg
سناریو سوم -

نکته‌ی دیگری که در SVM وجود دارد، در نظر نگرفتن داده‌هایی است که اصطلاحاً به آن‌ها داده‌های دور افتاده می‌گوییم.

داده‌های دور افتاده.jpg
داده‌های دور افتاده -

گاهی اوقات اما داده‌ها به گونه‌ای توزیع شده‌اند که با خط راست نمی‌توان آن را تقسیم بندی کرد. از اینرو در این شرایط میتوانیم دادهها را روی نموداری با محورهای X و Z نمایش دهیم به نحوی که Z، مجموع توان دوم X و Y باشد.

تقسیم بندی خط غیرراست.jpg
تقسیم بندی خط غیرراست -

اخبار مرتبط:

یادگیری ماشین چیست و چه کاربردی دارد؟

اگر به اخبار دنیای تکنولوژی علاقه مند هستید، ما را در شبکه‌های اجتماعی مختلف تلگرام، روبیکا، توییتر، اینستاگرام و آپارات همراهی کنید.

منبع خبر: faceit

IMG_20210301_202437.jpg

خدیجه زارعپور

فارغ التحصیل کارشناسی فناوری اطلاعات هستم. از اردیبهشت‌ماه 96 شروع به نوشتن معرفی محصول، اخبار و آموزش در حوزه تکنولوژی در فیسیت کردم. بیش‌تر از هر چیزی به شبکه‌های کامپیوتری، مجازی سازی، سیسکو و... علاقه‌مند هستم و بیشتر از اون علاقه‌مند به به‌اشتراک‌گذاری اطلاعات با بقیه...

در صورت داشتن هر گونه پیشنهاد و انتقاد نسبت به اخبار و مقالات، می‌تونید به این آدرس ایمیل بفرستید: khadijezarepour@gmail.com


1 نظر درباره‌ی این پست نوشته شده است.

وحید

پنجشنبه, 07 اسفند 1399

عالی بود امیدوارم این کارتون ادامه داشته باشه و توضحاتتون هم کاملتر

پاسخ

ثبت نظر