مقاله

معماری ترنسفورمر(Transformer) در مدل‌های زبانی بزرگ

معماری ترنسفورمر(Transformer) در مدل‌های زبانی بزرگ

ترنسفورمرها به عنوان یک تکنولوژی پیشگام ظاهر شده‌اند. ترنسفورمرها می‌توانند به طور همزمان به کل جمله نگاه کنند و این کار آنها را در تشخیص ظرافت‌های زبان بسیار کارآمد می‌کند. در واقع، مکانیزم توجه (Attention)، کلید اصلی موفقیت ترنسفورمرهاست.

هوشواره | دیروز
مقایسه بهترین مدل‌های زبانی بزرگ در هوش مصنوعی: آیا GPT بهترین است؟

مقایسه بهترین مدل‌های زبانی بزرگ در هوش مصنوعی: آیا GPT بهترین است؟

مدل‌های زبانی بزرگ قادر هستند انسان را در تسریع و تسهیل امور کمک کرده و پاسخ صحیحی در مسائل مختلف به او ارائه کنند.در این بخش قصد داریم بهترین مدل‌های زبانی بزرگ را مقایسه کنیم و تفاوت‌های کلیدی بین آن‌ها را بررسی نماییم.

هوشواره | ۲۰۲۴/۹/۲۳
مکانیزم توجه (Attention Mechanism) در یادگیری عمیق: تمرکز هوشمند در شبکه‌های عصبی

مکانیزم توجه (Attention Mechanism) در یادگیری عمیق: تمرکز هوشمند در شبکه‌های عصبی

مکانیزم توجه نوعی encoder-decoder در معماری شبکه عصبی است که به مدل اجازه می‌دهد در حین اجرای یک کار بر بخش‌های خاصی از ورودی تمرکز کند. در واقع به طور پویا به عناصر مختلف ورودی، وزن‌هایی را اختصاص می دهد که نشان دهنده اهمیت یا ارتباط نسبی آنها با خروجی مورد نظر است.

هوشواره | دیروز
یادگیری ماشین (Machine Learning) چیست؟

یادگیری ماشین (Machine Learning) چیست؟

یادگیری ماشین شاخه‌ای از هوش مصنوعی (AI) است که به سیستم‌ها توانایی یادگیری و بهبود خودکار از تجربه را بدون برنامه‌ریزی صریح می‌دهد. یادگیری ماشین بر توسعه برنامه‌های کامپیوتری تمرکز دارد که می‌توانند به داده‌ها دسترسی پیدا کنند و از آن‌ها برای یادگیری خود استفاده کنند.

هوشواره | دیروز