هوش مصنوعی ، جفری هینتون ، شبکه عصبی ، GLOM ، بردارها ، درک بصری ، درک انسان ، شهود


یادگیری عمیق آغاز جدیدترین انقلاب هوش مصنوعی بود که دید رایانه و زمینه را به طور کلی متحول کرد. هینتون معتقد است که یادگیری عمیق باید تقریباً هر آنچه برای تولید مثل کامل خرد انسان لازم است باشد.

اما با وجود پیشرفت سریع ، هنوز چالش های اساسی وجود دارد. شبکه عصبی را در معرض یک مجموعه داده ناشناخته یا محیط خارجی قرار دهید و مشخص شود که شکننده و انعطاف پذیر نیست. اتومبیل های خودران و مولدهای زبان برای نوشتن مقاله چشمگیر هستند ، اما همه چیز ممکن است اشتباه پیش رود. سیستم های بصری هوش مصنوعی را می توان به راحتی اشتباه گرفت: یک فنجان قهوه که از پهلو تشخیص داده می شود اگر سیستم به این منظر آموزش ندیده باشد از بالا ناشناخته خواهد بود و با دستکاری چند پیکسل می توان یک پاندا را با یک شترمرغ یا حتی یک اتوبوس مدرسه اشتباه گرفت.

GLOM با دو مشکل ترین سیستم های ادراک بصری سروکار دارد: درک کل صحنه از نظر اجسام و قسمتهای طبیعی آنها. و تشخیص اشیا when وقتی از دیدگاه جدید مشاهده می شود. (تمرکز GLOM بر روی بینایی است ، اما هینتون انتظار دارد که این ایده در مورد زبان نیز کاربرد داشته باشد.)

به عنوان مثال شیئی مانند صورت هینتون از چشمان زنده و خسته سگ وی تشکیل شده است (افراد زیادی س askال می کنند ؛ خواب کم) ، دهان و گوشهای او و بینی برآمده ، همه پوشیده از شبنم نه چندان زشت بیشتر خاکستری و با توجه به بینی اش ، حتی در نگاه اول از نظر مشخصات به راحتی قابل تشخیص است.

از نظر هینتون ، هر دو عامل – اتصال جزئی و دیدگاه – برای نحوه دید مردم تعیین کننده هستند. وی می گوید: “اگر GLOM هرگز م worksثر واقع شود ، این روش به گونه ای ایجاد می شود كه شباهت بیشتری به شبكه انسانی نسبت به شبكه های عصبی فعلی داشته باشد.”

با این حال ، گروه بندی قطعات در اهداف می تواند برای رایانه ها مشكل سختی باشد ، زیرا قطعات بعضی اوقات مبهم هستند. دایره می تواند یک چشم ، یا یک پیراشکی ، یا یک چرخ باشد. همانطور که هینتون توضیح می دهد ، نسل اول سیستم های بینایی هوش مصنوعی سعی می کند اشیا را تشخیص دهد ، بیشتر به هندسه رابطه بخشی کل متکی است – جهت گیری فضایی بین قطعات و بین قطعات و کل. در عوض ، نسل دوم بیشتر به یادگیری عمیق متکی بود – ترک شبکه عصبی برای یادگیری مقادیر زیادی داده. با GLOM ، هینتون بهترین جنبه های هر دو روش را با هم ترکیب می کند.

گری مارکوس ، بنیانگذار و مدیرعامل Robust.AI و منتقد برجسته وابستگی عمیق به یادگیری عمیق ، گفت: “فروتنی فکری خاصی وجود دارد که من در این زمینه دوست دارم.” مارکوس تمایل هینتون را برای به چالش کشیدن چیزی که باعث شهرت او شده است تحسین می کند ، تا بپذیرد که این اصلاً کارایی ندارد. او می گوید: “پررنگ است.” “و این یک تصحیح عالی است که بگویید ،” من سعی می کنم خارج از چارچوب فکر کنم. ” “

معماری GLOM

در ساخت GLOM ، هینتون سعی کرد برخی از میانبرهای ذهنی – استراتژی های شهودی یا اکتشافی – را که مردم برای درک جهان از آنها استفاده می کنند ، مدل سازی کند. نیک فراست می گوید: “GLOM ، و در واقع بسیاری از کارهای جف ، در مورد بررسی اکتشافاتی است که به نظر می رسد مردم دارند ، ساخت شبکه های عصبی که می توانند خود این اکتشافات را داشته باشند و سپس نشان می دهد که در نتیجه شبکه ها با دید بهتر عمل می کنند.” ، یک دانشمند کامپیوتر در یک زبان تازه کار در تورنتو که با هینتون در Google Brain کار می کرد.

در درک بصری ، یک استراتژی تجزیه و تحلیل بخشی از یک شی – به عنوان ویژگی های مختلف چهره – و در نتیجه درک کلی است. اگر بینی خاصی را مشاهده کنید ، می توانید آن را به عنوان بخشی از صورت هینتون تشخیص دهید. این تا حدی یک سلسله مراتب کامل است. برای ساختن یک سیستم بینایی بهتر ، هینتون می گوید ، “من یک شهود قوی دارم که ما باید از سلسله مراتب کامل استفاده کنیم.” مغز انسان با ایجاد یک اصطلاح “درخت نحوی” ، یک نمودار شاخه ای ، این ترکیب بخشی کامل را درک می کند. ارتباط سلسله مراتبی بین کل ، قطعات و اجزای آن را نشان می دهد. صورت خود در بالای درخت است و چشم ها ، بینی ، گوش ها و دهان مرکب شاخه های زیر را تشکیل می دهند.

یکی از اهداف اصلی هینتون با GLOM تولید مثل درخت نحو در یک شبکه عصبی است – و این باعث تمایز آن از شبکه های عصبی قبلی می شود. به دلایل فنی ، انجام آن دشوار است. فراست می گوید: “این دشوار است زیرا هر تصویر توسط شخصی در یک درخت تجزیه کننده تجزیه و تحلیل می شود ، بنابراین ما دوست داریم یک شبکه عصبی نیز چنین کاری را انجام دهد.” “به دست آوردن چیزی با معماری ساکن – یک شبکه عصبی – درک یک ساختار جدید – یک درخت نحوی – برای هر تصویر جدیدی که می بیند دشوار است.” هینتون تلاش های مختلفی کرده است. GLOM تجدید نظر عمده ای در تجربه قبلی خود در سال 2017 است که همراه با سایر دستاوردهای مرتبط در این زمینه است.

“من بخشی از بینی هستم!”

بردار GLOM

جلوپنجره جلو هینتون

MS TECH | EVIATAR BACH از طریق ویکی مدیا

یک روش کلی تفکر درباره معماری GLOM به شرح زیر است: تصویر جالب (مثلاً تصویری از چهره هینتون) به یک شبکه تقسیم می شود. هر منطقه از شبکه “محل” تصویر است – یک مکان ممکن است دارای عنبیه چشم باشد ، در حالی که یک مکان دیگر ممکن است نوک بینی آن باشد. برای هر مکان شبکه حدود پنج لایه یا سطح وجود دارد. و سطح به سطح ، سیستم پیش بینی می کند ، زیرا بردار نشان دهنده محتوا یا اطلاعات است. در یک سطح نزدیک به پایین ، بردار نشان دهنده محل نوک بینی می تواند پیش بینی کند ، “من بخشی از بینی هستم!” و در سطح بعدی بالاتر ، در ساخت یک نمایش منسجم تر از آنچه می بیند ، بردار می تواند پیش بینی کند: “من بخشی از چهره در گوشه کناری هستم!”

اما س theال این است که آیا بردارهای همسایه در همان سطح موافقند؟ وقتی موافقت می کنند ، بردارها در یک جهت و به یک نتیجه اشاره می کنند: “بله ، ما هر دو متعلق به یک بینی هستیم.” یا درخت نحو را بالا ببرید. “بله ، ما هر دو متعلق به یک شخص هستیم.”

به دنبال اجماع در مورد ماهیت جسم – در مورد دقیقاً دقیقاً شی بودن چیست – بردارهای تکرار شونده GLOM ، مکان بر اساس مکان و لایه به لایه ، به طور متوسط ​​با بردارهای مجاور تا بالا ، و همچنین بردارهای پیش بینی شده از سطح بالا و پایین.

هینتون گفت ، با این حال ، شبکه “به طور متوسط ​​خواسته و ناخواسته” فقط با چیزی در نزدیکی نیست. میانگین آن به صورت انتخابی است و پیش بینی های همسایه شباهت هایی را نشان می دهد. او می گوید: “این چیزی است که در آمریکا کاملاً شناخته شده است و به آن دوربین اکو می گویند.” “آنچه شما انجام می دهید پذیرش عقاید فقط از افرادی است که قبلاً با شما موافق هستند. و سپس شما به طور تصادفی یک دوربین اکو دریافت خواهید کرد که در آن تعداد زیادی از افراد نظر مشابهی دارند. GLOM در واقع از این روش به صورت سازنده استفاده می کند. “یک پدیده مشابه در سیستم هینتون” جزایر رضایت “است.

“جف یک متفکر بسیار غیر معمول است …”

سو بکر

فراست می گوید: “تصور كنید كه یك نفر در یك اتاق با تغییر اندكی از همان ایده جیغ می كشند ، یا تصور كنید كه این افراد بردارهایی هستند كه تغییرات كمی را در همان جهت نشان می دهند.” “بعد از مدتی ، آنها برای یک ایده دور هم جمع می شدند و همه احساس قویتر می کردند ، زیرا توسط دیگر افراد اطرافشان تأیید شده بودند.” اینگونه بردارهای GLOM پیش بینی های تصویری جمعی آنها را تقویت و تقویت می کنند.

GLOM با استفاده از این جزایر بردارهای همسان ترفند ارائه درخت نحوی را در شبکه عصبی انجام می دهد. در حالی که برخی از شبکه های عصبی اخیر از توافق بین بردارها برای استفاده می کنند فعال سازی، GLOM از توافق نامه ای برای استفاده می کند نمایندگی– ارائه موارد در وب را بسازید. به عنوان مثال ، هنگامی که چندین بردار توافق می کنند که همه آنها بخشی از بینی را تشکیل می دهند ، خوشه کوچک توافق آنها به طور کلی نشان دهنده بینی در درخت تجزیه و تحلیل شبکه صورت است. گروه کوچک دیگری از بردارهای منطبق ممکن است دهان را در درخت نحو نشان دهند. و خوشه بزرگ بالای درخت نشان دهنده این نتیجه است که تصویر به طور کلی چهره هینتون است. نحوه ارائه درخت تجزیه در اینجا ، “توضیح می دهد هینتون ،” این است که در سطح جسم شما یک جزیره بزرگ دارید. بخشهایی از سایت جزایر کوچکتری هستند. قطعات حتی جزایر کوچکتر و غیره “

شکل 2 مقاله Hinton GLOM. جزایر با بردارهای یکسان (فلشهای همرنگ) در سطوح مختلف ، یک درخت نحوی را نشان می دهند.

جئوفر هینتون

به گفته دوست و همکار دیرینه هینتون ، جوشوا بنجو ، دانشمند کامپیوتر در دانشگاه مونترال، اگر GLOM در حل چالش مهندسی ارائه یک درخت نحوی در یک شبکه عصبی موفق شود ، این یک شاهکار است – این برای عملکرد مناسب شبکه های عصبی مهم است. بنجو می گوید: “جف بارها در زندگی حرفه ای خود شهودهای شگفت آور قدرتمندی ایجاد کرده است که بسیاری از آنها درست بودن خود را ثابت کرده اند.” “به همین دلیل من به آنها توجه می کنم ، به خصوص وقتی که او به اندازه احساس GLOM نسبت به آنها احساس کند.”

اعتقاد هینتون نه تنها در تشبیه اتاق اکو ریشه دارد ، بلکه در تشابهات ریاضی و بیولوژیکی نیز وجود دارد که برخی از تصمیمات طراحی در مهندسی جدید GLOM را الهام گرفته و توجیه می کند.

سو بکر ، دانشجوی سابق هینتون ، که اکنون یک متخصص مغز و اعصاب شناختی محاسباتی در دانشگاه مک مستر است ، گفت: “جف یک متفکر بسیار غیرمعمول است زیرا او قادر است از مفاهیم پیچیده ریاضی استفاده کند و آنها را با محدودیت های بیولوژیکی ادغام کند.” “محققانی که تمرکز بیشتری بر نظریه ریاضی یا نوروبیولوژی دارند ، بسیار کمتر احتمال دارد معما فوق العاده جذاب چگونگی یادگیری و تفکر هر دو ماشین و انسان را حل کنند.”

تبدیل فلسفه به مهندسی

تاکنون ایده جدید هینتون به خصوص در بزرگترین دوربین های اکو جهان با استقبال خوبی روبرو شده است. او می گوید: “من در توییتر خیلی دوست دارم.” و درسی در YouTube ادعا کرد که اصطلاح “MeGLOMania” است.

هینتون اولین کسی بود که اذعان کرد GLOM اکنون چیزی بیش از تأمل فلسفی نیست (او قبل از اینکه به روانشناسی تجربی بپردازد ، یک سال را به عنوان فیلسوف گذراند). وی می گوید: “اگر ایده ای در فلسفه خوب به نظر برسد ، خوب است.” “چگونه می توانید یک ایده فلسفی داشته باشید که فقط به نظر می رسد مانند زباله است ، اما در واقع واقعی از آب در آمده است؟” این به عنوان یک ایده فلسفی عبور نخواهد کرد. وی گفت: “برای مقایسه ، علم” پر از چیزهایی است كه به نظر می رسد مانند زباله های كامل است “، اما به نظر می رسد كه بسیار خوب كار می كند – برای مثال مانند شبكه های عصبی.”

GLOM طوری طراحی شده است که از نظر فلسفی قابل قبول به نظر برسد. اما آیا م workثر خواهد بود؟


منبع: unbox-khabar.ir

Leave a reply

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>