این سلاح های رباتیک مجازی با یادگیری از یکدیگر هوشمندتر می شوند


این ربات مجازی یاد گرفته است که بدون نیاز به آموزش مجدد برای هر کار ، طیف گسترده ای از معماها – مرتب سازی بلوک ها ، چیدمان میز ، ترتیب قطعات شطرنج – را حل کند. او این کار را با بازی در برابر یک ربات دست دوم انجام داد که برای ایجاد چالش های دشوارتر به او آموزش دیده بود.

خود بازی: دستان رباتیک یکسان – آلیس و باب – که توسط محققان OpenAI ساخته شده است ، با بازی در مقابل یکدیگر در یک شبیه سازی و بدون ورود انسان ، یاد می گیرند. روبات ها از آموزش تقویت استفاده می کنند ، تکنیکی که در آن هوش مصنوعی از طریق آزمون و خطا آموزش می یابد که چه اقداماتی را باید در موقعیت های مختلف انجام دهد تا اهداف خاصی را محقق کند. این بازی شامل انتقال اشیا به یک میز کار مجازی است. آلیس با مرتب کردن اشیا به روش های خاص سعی دارد معماهایی را تنظیم کند که باب به سختی می تواند آنها را حل کند. باب سعی می کند معما های آلیس را حل کند. همانطور که یاد می گیرند ، آلیس معماهای پیچیده تری تنظیم می کند و باب در حل آنها بهتر می شود.

چند وظیفه ای: مدلهای آموزش عمیق معمولاً باید بین وظایف دوباره آموزش ببینند. به عنوان مثال ، AlphaZero (که با بازی در مقابل خود نیز یاد می گیرد) از الگوریتمی برای یادگیری شطرنج ، شوگی و Go استفاده می کند – اما فقط یک بار در یک زمان. بازیکن شطرنج AlphaZero نمی تواند Go بازی کند ، و Go-playing نمی تواند شوگی بازی کند. ساخت ماشین هایی که واقعاً می توانند بسیاری از کارها را انجام دهند ، مسئله بزرگی است که در مسیر دستیابی به هوش مصنوعی عمومی حل نشده است.

dojo هوش مصنوعی: یکی از موضوعات این است که آموزش هوش مصنوعی برای چند وظیفه ای به تعداد زیادی مثال نیاز دارد. OpenAI با آموزش آلیس برای تولید نمونه هایی از باب استفاده از یک هوش مصنوعی برای آموزش دیگری ، از این امر جلوگیری می کند. آلیس آموخت که اهدافی مانند ساخت برج از بلوک ها ، سپس بلند کردن و تعادل بخشیدن آن را تعیین کند. باب آموخت که از خصوصیات محیط (مجازی) مانند اصطکاک برای گرفتن و چرخش اشیا استفاده کند.

واقعیت مجازی: تاکنون ، این روش فقط در یک شبیه سازی آزمایش شده است ، اما محققان OpenAI و سایر کشورها در حال بهبود انتقال مدل های آموزش دیده در یک محیط مجازی به یک محیط فیزیکی هستند. این شبیه سازی به هوش مصنوعی اجازه می دهد تا برای مدت کوتاهی قبل از اینکه برای تنظیمات واقعی تنظیم شود ، در مجموعه داده های بزرگ پیمایش کند.

جاه طلبی کلی: محققان می گویند که هدف نهایی آنها آموزش روبات برای حل هر کاری است که ممکن است بپرسد. مانند GPT-3 ، یک مدل زبانی که می تواند از زبان به طرق مختلف استفاده کند ، این دستان رباتیک بخشی از آرزوی کلی OpenAI برای ساخت AI چند وظیفه ای هستند. استفاده از یک هوش مصنوعی برای آموزش دیگری می تواند قسمت اصلی این امر باشد.


منبع: unbox-khabar.ir

Leave a reply

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>