مرور رده

یادگیری ماشین

کاهش ویژگی (Feature reduction)

کاهش ویژگی ازجمله اقدامات پیش‌پردازش داده‌های مسائل یادگیری ماشین است، که با در نظر گرفتن این موضوع که برخی از ویژگی‌های مسئله باهم همبستگی و ارتباط دارند، برخی از ویژگی‌ها را حذف و تنها مؤلفه‌های اصلی مسئله را حفظ می‌کند. در این مقاله…

گراف دانش

در دنیای داده‌ها، اطلاعات بسیار ارزشمند هستند. گاهی به دلیل قوانین باید از آن محافظت شود بنابراین نمی‌توان به ‌کل اطلاعات درباره‌ی یک مورد خاص دسترسی داشت.

Theano

Theano یک کتابخانه‌ی رایگان یادگیری عمیق به زبان پایتون است که در محاسبات عددی کاربرد دارد و برای اجرا بر روی CPU و GPU طراحی شده است.

مدل‌های مبتنی بر انرژی (energy based models)

مدل‌های مبتنی بر انرژی توزیع احتمال را بر روی داده‌ها با اختصاص یک مقیاس (یا "انرژی") به هر نقطه داده ورودی نشان می‌دهند. این قابلیت انعطاف‌پذیری مدل‌سازی مفیدی را فراهم می‌کند. هر مدل دلخواه که یک عدد واقعی را با توجه به ورودی تولید کند،…

استخراج ویژگی و انتخاب ویژگی

انتخاب ویژگی اهمیت ویژگی‌های موجود را رتبه‌بندی می‌کند و آن‌هایی که اهمیت کم‌تری دارند را کنار می‌گذارد (هیچ ویژگی جدیدی تولید نمی‌شود). استخراج ویژگی تعداد ویژگی‌های دیتاست را کاهش می‌دهد؛ از طریق ایجاد ویژگی‌های جدید از ویژگی‌های موجود و…

مدل Transformer

مدل Transformer یک شبکه عصبی خاص برای کارهای پردازش زبان طبیعی است، که از آن برای افزایش سرعت آموزش مدل‌های شبکه عصبی استفاده می‌شود. بزرگ‌ترین فایده این مدل موازی‌سازی عملکرد ترجمه زبان‌ها است. در این مقاله با نگاهی ساده مدل Transformer…

یادگیری آماری (Statistical learning theory)

اصل و اساس علم داده، یادگیری بر اساس داده‌های موجود است که از طریق علم یادگیری آماری صورت می‌گیرد. تئوری یادگیری آماری، چارچوبی برای یادگیری ماشین تحت نظارت و بدون نظارت است، که بر مبنای آمار و تحلیل تابع بنا شده است. در واقع این تئوری با…

شناسایی موجودیت‌های نام دار (Named Entity Recognition)

شناسایی موجودیت‌های نام دار (Named Entity Recognition | NER)، کاری رایج در پردازش زبان طبیعی (NLP) است، که موجودیت‌های متن را تشخیص و برای دسته‌بندی برچسب می‌زند، که نام مکان، شرکت، شخص، دارو، بیماری و ... می‌تواند باشد.

مقیاس‌گذاری ویژگی‌ها

مقیاس‌گذاری‌ ویژگی‌ها یکی از مهم‌ترین مراحل پیش‌پردازش داده‌ها در یادگیری ماشین است و بسیار ضروری است زیرا فاصله‌ی بین داده‌ها را می‌سنجد. در این صورت است که می‌توانیم بین یک مدل ضعیف و یک مدل قوی در یادگیری ماشین تفاوت قائل شویم. از …