Gradient Clipping یکی از روشهایی است، که برای جلوگیری از انفجار گرادیان استفاده میشود. در ادامه ابتدا انفجار گرادیان را تعریف کرده و Gradient Clipping را بهعنوان یک راهحل ارائه میدهیم.
در حوزه یادگیری دادهها یکی از چالشهای مطرح استخراج ویژگیهای موردنیاز برای مسئله است. در یادگیری ماشین بایستی تمام ویژگیها را بهعنوان ورودی به مسئله بدهیم، اما برخلاف آن یادگیری عمیق (Deep Learning) و شبکه عصبی (Neural Network)، این…
مدل Transformer یک شبکه عصبی خاص برای کارهای پردازش زبان طبیعی است، که از آن برای افزایش سرعت آموزش مدلهای شبکه عصبی استفاده میشود. بزرگترین فایده این مدل موازیسازی عملکرد ترجمه زبانها است. در این مقاله با نگاهی ساده مدل Transformer…
شبکههای عصبی تصادفی و مولدی هستند که مشکلات ترکیبی دشوار را حل میکنند. درواقع الگوریتمهایی هستند که برای کاهش ابعاد، طبقهبندی، رگرسیون، فیلتر کردن، یادگیری ویژگیها و مدلسازی استفاده میشوند.
شبکههای عصبی کانولوشنی با پیچشی یکی از مهمترین انواع شبکههای عصبی هستند که کاربردهای بسیاری در یادگیری عمیق دارند. این شبکهها در پردازش تصویر، تولید صوت، ژنتیک و اخترفیزیک مورد استفاده قرار میگیرند. در این مقاله به معرفی این نوع…
شبکههای LSTM نوعی از شبکههای بازگشتی (RNN) هستند که قادر به یادگیری روابط طولانی مدت (مانند آنچه که در بازارهای سهام و بورس رخ میدهد) هستند و امروزه برای موارد مختلف و متنوعی به کار گرفته میشوند.