چکیده
مدل یا application با نام word2vec توسط Mikolov و همکارانش ارائه شده است. این مدل در سالهای اخیر توجه زیادی را به خود جلب کرده است. نمایش برداری کلمات توسط مدل یادگیری word2vec برای ارائه معنای مفاهیم امکانپذیر است که در انواع وظایف از نوع NLP کاربرد دارد. بنا به افزایش تعداد تحقیقات و آزمایشات موجود در این زمینه، نبود یک توصیف فراگیر و جامع برای پارامترهای فرآیند یادگیری مدلهای نهفته کلمات بهصورت جزئی، توجه مرا به خود جلب کرد. بنابراین بهمنظور جلوگیری از انجام تحقیقات غیرتخصصی در شبکههای عصبی بهدلیل عدم فهم مکانیزم کارایی چنین مدلهایی، این مقاله ارائه شده است.
این مقاله، جزئیات و توصیف پارامترهای مدلهای word2vec را نشان میدهد، که شامل مدلهای پیوسته bag-of-word (CBOW) و مدلهای skip-gram (SG)، همانند تکنیکهای بهینهسازی پیشرفته، از جمله softmax سلسله مراتبی و نمونه منفی است. تفسیر معادلات شیب نیز در کنار مشتقات ریاضی ارائه شده است.
در پیوست، یک بررسی بر روی اصول اولیه شبکه عصبی و انتشار به عقب ارائه شده است. من هم یک نسخهی نمایشی تعاملی، بهمنظور تسهیل درک بصری از مدل ارائه کردهام.
ترجمه این مقاله با عنوان پارامترهای یادگیری در سایت ای ترجمه به صورت رایگان قابل دانلود می باشد. جهت دانلود رایگان مقاله فارسی و انگلیسی روی عنوان فارسی (آبی رنگ) کلیک نمایید.
منبع:
word2vec Parameter Learning Explained