یادگیری ماشینی چیست؟

یادگیری ماشین (ML) برخی از مهمترین فناوری‌هایی که ما استفاده می‌کنیم، از برنامه‌های ترجمه گرفته تا وسایل نقلیه خودران، را تقویت می‌کند. این دوره مفاهیم اصلی پشت یادگیری ماشین را توضیح می‌دهد.

یادگیری ماشینی (ML) راهی جدید برای حل مشکلات، پاسخ به سوالات پیچیده و ایجاد محتوای جدید ارائه می‌دهد. یادگیری ماشینی می‌تواند آب و هوا را پیش‌بینی کند، زمان سفر را تخمین بزند، آهنگ پیشنهاد دهد، جملات را به صورت خودکار تکمیل کند، مقالات را خلاصه کند و تصاویر دیده نشده‌ای را تولید کند.

به طور کلی، یادگیری ماشین فرآیند آموزش یک قطعه نرم‌افزاری به نام مدل است تا پیش‌بینی‌های مفیدی انجام دهد یا از داده‌ها محتوا (مانند متن، تصویر، صدا یا ویدیو) تولید کند.

برای مثال، فرض کنید می‌خواهیم اپلیکیشنی برای پیش‌بینی بارندگی بسازیم. می‌توانیم از رویکرد سنتی یا رویکرد یادگیری ماشینی استفاده کنیم. با استفاده از رویکرد سنتی، یک نمایش مبتنی بر فیزیک از جو و سطح زمین ایجاد می‌کنیم و مقادیر عظیمی از معادلات دینامیک سیالات را محاسبه می‌کنیم. این کار فوق‌العاده دشوار است.

با استفاده از رویکرد یادگیری ماشینی، ما حجم عظیمی از داده‌های آب و هوایی را به یک مدل یادگیری ماشینی می‌دهیم تا در نهایت مدل رابطه ریاضی بین الگوهای آب و هوایی که مقادیر مختلف باران را تولید می‌کنند، بیاموزد. سپس داده‌های آب و هوایی فعلی را به مدل می‌دهیم و مدل میزان باران را پیش‌بینی می‌کند.

درک خود را بررسی کنید

«مدل» در یادگیری ماشین چیست؟
یک مدل، یک رابطه ریاضی مشتق شده از داده‌ها است که یک سیستم یادگیری ماشین از آن برای پیش‌بینی استفاده می‌کند.
مدل، قطعه‌ای از سخت‌افزار کامپیوتر است
یک مدل، نمایش کوچک‌تری از چیزی است که شما در حال مطالعه آن هستید.

انواع سیستم‌های یادگیری ماشینی

سیستم‌های یادگیری ماشینی بر اساس نحوه یادگیری پیش‌بینی یا تولید محتوا، در یک یا چند دسته زیر قرار می‌گیرند:

  • یادگیری تحت نظارت
  • یادگیری بدون نظارت
  • یادگیری تقویتی
  • هوش مصنوعی مولد

یادگیری تحت نظارت

مدل‌های یادگیری نظارت‌شده می‌توانند پس از مشاهده داده‌های فراوان با پاسخ‌های صحیح و سپس کشف ارتباطات بین عناصر موجود در داده‌ها که پاسخ‌های صحیح را تولید می‌کنند، پیش‌بینی‌هایی انجام دهند. این مانند یادگیری مطالب جدید توسط دانش‌آموز با مطالعه امتحانات قدیمی است که شامل سوالات و پاسخ‌ها هستند. هنگامی که دانش‌آموز به اندازه کافی در امتحانات قدیمی آموزش دیده باشد، برای شرکت در امتحان جدید کاملاً آماده است. این سیستم‌های یادگیری ماشینی به این معنا "نظارت‌شده" هستند که یک انسان داده‌هایی را با نتایج صحیح شناخته شده به سیستم یادگیری ماشینی می‌دهد.

دو مورد از رایج‌ترین موارد استفاده از یادگیری نظارت‌شده، رگرسیون و طبقه‌بندی هستند.

رگرسیون

یک مدل رگرسیون یک مقدار عددی را پیش‌بینی می‌کند. برای مثال، یک مدل آب و هوایی که میزان باران را بر حسب اینچ یا میلی‌متر پیش‌بینی می‌کند، یک مدل رگرسیون است.

برای مثال‌های بیشتر از مدل‌های رگرسیون، به جدول زیر مراجعه کنید:

سناریو داده‌های ورودی ممکن پیش‌بینی عددی
قیمت مسکن در آینده متراژ، کد پستی، تعداد اتاق خواب و حمام، مساحت زمین، نرخ بهره وام مسکن، نرخ مالیات بر دارایی، هزینه‌های ساخت و ساز و تعداد خانه‌های فروشی در منطقه. قیمت خانه.
زمان سواری آینده شرایط ترافیکی گذشته (جمع‌آوری‌شده از تلفن‌های هوشمند، حسگرهای ترافیک، سرویس‌های اشتراک خودرو و سایر برنامه‌های ناوبری)، فاصله از مقصد و شرایط آب و هوایی. زمان رسیدن به مقصد بر حسب دقیقه و ثانیه.

طبقه‌بندی

مدل‌های طبقه‌بندی احتمال تعلق چیزی به یک دسته را پیش‌بینی می‌کنند. برخلاف مدل‌های رگرسیون که خروجی آنها یک عدد است، مدل‌های طبقه‌بندی مقداری را خروجی می‌دهند که بیان می‌کند آیا چیزی به یک دسته خاص تعلق دارد یا خیر. به عنوان مثال، از مدل‌های طبقه‌بندی برای پیش‌بینی اینکه آیا یک ایمیل هرزنامه است یا اینکه آیا یک عکس حاوی گربه است، استفاده می‌شود.

مدل‌های طبقه‌بندی به دو گروه تقسیم می‌شوند: طبقه‌بندی دودویی و طبقه‌بندی چندکلاسه. مدل‌های طبقه‌بندی دودویی مقداری را از کلاسی که فقط شامل دو مقدار است، خروجی می‌دهند، برای مثال، مدلی که خروجی آن rain یا no rain . مدل‌های طبقه‌بندی چندکلاسه مقداری را از کلاسی که شامل بیش از دو مقدار است، خروجی می‌دهند، برای مثال، مدلی که می‌تواند rain ، hail ، snow یا sleet را خروجی دهد.

درک خود را بررسی کنید

اگر بخواهید از یک مدل یادگیری ماشین برای پیش‌بینی مصرف انرژی ساختمان‌های تجاری استفاده کنید، از چه نوع مدلی استفاده خواهید کرد؟
رگرسیون
مصرف انرژی با واحد کیلووات ساعت (kWh) اندازه‌گیری می‌شود که یک عدد است، بنابراین باید از یک مدل رگرسیون استفاده کنید.
طبقه‌بندی
مدل‌های طبقه‌بندی پیش‌بینی می‌کنند که آیا چیزی به یک دسته تعلق دارد یا خیر، در حالی که مدل‌های رگرسیون یک عدد را پیش‌بینی می‌کنند. از آنجا که مصرف انرژی با کیلووات ساعت (kWh) اندازه‌گیری می‌شود که یک عدد است، بهتر است از یک مدل رگرسیون استفاده کنید.

یادگیری بدون نظارت

یک مدل یادگیری بدون نظارت با هدف شناسایی الگوهای معنادار در یک مجموعه داده طراحی شده است. به عنوان مثال، بسیاری از مدل‌های یادگیری بدون نظارت برای سازماندهی داده‌های مشابه در گروه‌ها ("خوشه‌ها") به تکنیکی به نام خوشه‌بندی متکی هستند.

تصویری که نقاط رنگی را به صورت خوشه‌ای نشان می‌دهد.

شکل ۱. یک مدل یادگیری ماشینی که نقاط داده مشابه را خوشه‌بندی می‌کند.

تصویری که نقاط رنگی را در خوشه‌هایی نشان می‌دهد که در یک شکل محصور شده‌اند و با یکدیگر هم‌مرز هستند.

شکل ۲. گروه‌هایی از خوشه‌ها با مرزهای طبیعی.

خوشه‌بندی با طبقه‌بندی متفاوت است زیرا دسته‌ها توسط شما تعریف نمی‌شوند. برای مثال، یک مدل بدون نظارت ممکن است یک مجموعه داده آب و هوا را بر اساس دما خوشه‌بندی کند و تقسیم‌بندی‌هایی را نشان دهد که فصول را تعریف می‌کنند. سپس می‌توانید بر اساس درک خود از مجموعه داده، سعی کنید آن خوشه‌ها را نامگذاری کنید.

تصویری که نقاط رنگی را در خوشه‌هایی نشان می‌دهد که به عنوان برف، باران، تگرگ و بدون باران برچسب‌گذاری شده‌اند.

شکل 3. یک مدل یادگیری ماشینی که الگوهای آب و هوایی مشابه را خوشه‌بندی می‌کند.

تصویری که نقاط رنگی را در خوشه‌هایی نشان می‌دهد که به عنوان برف، باران، تگرگ و بدون باران برچسب‌گذاری شده‌اند و در یک شکل محصور شده و با یکدیگر هم‌مرز هستند.

شکل ۴. خوشه‌های الگوهای آب و هوایی که به صورت برف، تگرگ، باران و بدون باران برچسب‌گذاری شده‌اند.

درک خود را بررسی کنید

چه چیزی رویکرد نظارت‌شده را از رویکرد بدون نظارت متمایز می‌کند؟
در رویکرد نظارت‌شده، داده‌هایی که حاوی پاسخ صحیح هستند، ارائه می‌شود.
به یک رویکرد نظارت‌شده، داده‌هایی داده می‌شود که حاوی پاسخ صحیح هستند. وظیفه مدل، یافتن ارتباطاتی در داده‌ها است که پاسخ صحیح را تولید می‌کنند. به یک رویکرد نظارت‌نشده، داده‌هایی بدون پاسخ صحیح داده می‌شود. وظیفه آن یافتن گروه‌بندی‌ها در داده‌ها است.
یک رویکرد نظارت‌شده معمولاً از خوشه‌بندی استفاده می‌کند.
یک رویکرد بدون نظارت از خوشه‌بندی استفاده می‌کند.
یک رویکرد بدون نظارت می‌داند که چگونه خوشه‌های داده‌ها را برچسب‌گذاری کند.
یک رویکرد بدون نظارت نمی‌داند خوشه‌های داده‌ها به چه معناست. بر اساس درک شما از داده‌ها، تعریف آنها به عهده شماست.

یادگیری تقویتی

مدل‌های یادگیری تقویتی با دریافت پاداش یا جریمه بر اساس اقدامات انجام شده در یک محیط، پیش‌بینی‌هایی انجام می‌دهند. یک سیستم یادگیری تقویتی، سیاستی را ایجاد می‌کند که بهترین استراتژی را برای دریافت بیشترین پاداش تعریف می‌کند.

یادگیری تقویتی برای آموزش ربات‌ها جهت انجام وظایفی مانند راه رفتن در اتاق و برنامه‌های نرم‌افزاری مانند AlphaGo برای انجام بازی Go استفاده می‌شود.

هوش مصنوعی مولد

هوش مصنوعی مولد ، دسته‌ای از مدل‌ها است که از ورودی کاربر، محتوا ایجاد می‌کند. برای مثال، هوش مصنوعی مولد می‌تواند تصاویر، آهنگ‌ها و جوک‌های منحصر به فرد ایجاد کند؛ می‌تواند مقالات را خلاصه کند، نحوه انجام یک کار را توضیح دهد یا یک عکس را ویرایش کند.

هوش مصنوعی مولد می‌تواند ورودی‌های متنوعی را دریافت کرده و خروجی‌های متنوعی مانند متن، تصویر، صدا و ویدئو ایجاد کند. همچنین می‌تواند ترکیبی از این موارد را دریافت و ایجاد کند. به عنوان مثال، یک مدل می‌تواند یک تصویر را به عنوان ورودی دریافت کرده و یک تصویر و متن را به عنوان خروجی ایجاد کند، یا یک تصویر و متن را به عنوان ورودی دریافت کرده و یک ویدئو به عنوان خروجی ایجاد کند.

ما می‌توانیم مدل‌های مولد را بر اساس ورودی‌ها و خروجی‌هایشان مورد بحث قرار دهیم، که معمولاً به صورت «نوع ورودی» به «نوع خروجی» نوشته می‌شوند. برای مثال، در زیر فهرستی جزئی از برخی ورودی‌ها و خروجی‌ها برای مدل‌های مولد آمده است:

  • متن به متن
  • تبدیل متن به تصویر
  • تبدیل متن به ویدیو
  • تبدیل متن به کد
  • تبدیل متن به گفتار
  • تصویر و متن به تصویر

جدول زیر شامل نمونه‌هایی از مدل‌های مولد، ورودی و خروجی احتمالی آنها است:

مدل ورودی خروجی مثال
متن به متن چه کسی مسابقه لمانز را ابداع کرد؟ مسابقات ۲۴ ساعته لمانز توسط باشگاه اتومبیل‌رانی غرب (ACO)، یک سازمان اتومبیل‌رانی که در سال ۱۹۰۶ تأسیس شد، تأسیس شد. اولین مسابقه در ۲۶ و ۲۷ مه ۱۹۲۳ در پیست سارت، یک پیست جاده‌ای ۱۳.۴۲۶ کیلومتری (۸.۳۴۵ مایلی) واقع در نزدیکی شهر لمانز در فرانسه، برگزار شد. این مسابقه در ابتدا به عنوان راهی برای تبلیغ ACO و منطقه سارت در نظر گرفته شده بود.
منبع: بارد
تبدیل متن به تصویر یک اختاپوس بیگانه هنگام خواندن روزنامه از طریق پورتالی شناور می‌شود. تصویر یک اختاپوس کارتونی.
منبع: ایمجین
تبدیل متن به ویدیو یک خرس عروسکی واقع‌گرایانه در اقیانوس سانفرانسیسکو شنا می‌کند. خرس عروسکی به زیر آب می‌رود. خرس عروسکی به شنا کردن زیر آب با ماهی‌های رنگارنگ ادامه می‌دهد. یک خرس پاندا در زیر آب شنا می‌کند. ویدیویی از شنا کردن یک خرس عروسکی در زیر آب.
منبع: فناکی
تبدیل متن به کد یک حلقه پایتون بنویسید که روی لیستی از اعداد بچرخد و اعداد اول را چاپ کند.
for number in numbers:
  # Check if the number is prime.
  is_prime = True
  for i in range(2, number):
    if number % i == 0:
        is_prime = False
        break
  # If the number is prime, print it.
  if is_prime:
    print(number)

منبع: بارد
تبدیل تصویر به متن تصویر یک فلامینگو. این یک فلامینگو است. آنها در کارائیب یافت می‌شوند.
منبع: گوگل دیپ مایند

هوش مصنوعی مولد چگونه کار می‌کند؟ در سطح بالا، مدل‌های مولد، الگوهای موجود در داده‌ها را با هدف تولید داده‌های جدید اما مشابه یاد می‌گیرند. مدل‌های مولد مانند موارد زیر هستند:

  • کمدین‌هایی که با مشاهده رفتارها و سبک صحبت کردن دیگران، تقلید از آنها را یاد می‌گیرند.
  • هنرمندانی که با مطالعه‌ی نقاشی‌های فراوان در یک سبک خاص، نقاشی در آن سبک را یاد می‌گیرند.
  • گروه‌های موسیقی کاور که با گوش دادن به آهنگ‌های زیاد یک گروه موسیقی خاص، یاد می‌گیرند که شبیه آن گروه موسیقی خاص به نظر برسند.

برای تولید خروجی‌های منحصر به فرد و خلاقانه، مدل‌های مولد در ابتدا با استفاده از یک رویکرد بدون نظارت آموزش داده می‌شوند، که در آن مدل یاد می‌گیرد داده‌هایی را که بر اساس آنها آموزش دیده است، تقلید کند. این مدل گاهی اوقات با استفاده از یادگیری نظارت شده یا تقویتی بر روی داده‌های خاص مربوط به وظایفی که ممکن است از مدل خواسته شود انجام دهد، مانند خلاصه کردن یک مقاله یا ویرایش یک عکس، بیشتر آموزش داده می‌شود.

هوش مصنوعی مولد، فناوری‌ای است که به سرعت در حال تکامل است و موارد استفاده جدیدی به طور مداوم در حال کشف شدن است. به عنوان مثال، مدل‌های مولد با حذف خودکار پس‌زمینه‌های مزاحم یا بهبود کیفیت تصاویر با وضوح پایین، به کسب‌وکارها کمک می‌کنند تا تصاویر محصولات تجارت الکترونیک خود را اصلاح کنند.