مدل های زبانی مانند GPT-3 می تواند نوع جدیدی از موتور جستجو را بشارت دهد


اکنون تیمی از محققان Google پیشنهادی را برای یک طراحی مجدد بنیادی منتشر کرده اند که رویکرد رتبه بندی را کنار می گذارد و یک مدل بزرگ را به زبان AI مانند BERT یا GPT-3 – یا نسخه های بعدی جایگزین می کند. ایده این است که کاربران به جای جستجوی اطلاعات در لیست گسترده ای از صفحات وب ، س questionsالاتی را مطرح می کنند و مدل زبانی که در آن صفحات آموزش دیده است ، مستقیماً به آنها پاسخ می دهد. این رویکرد می تواند نه تنها نحوه کار موتورهای جستجو ، بلکه عملکرد آنها – و نحوه تعامل ما با آنها را تغییر دهد

موتورهای جستجو حتی با انفجار اندازه وب سریعتر و دقیق تر شده اند. اکنون هوش مصنوعی برای رتبه بندی نتایج استفاده می شود و Google برای درک بهتر سوالات جستجو از BERT استفاده می کند. با این وجود ، همه موتورهای جستجوی انبوه هنوز به همان روشی که 20 سال پیش کار می کردند ، کار می کنند: صفحات وب توسط ربات ها نمایه می شوند (نرم افزاری که وب را بدون وقفه می خواند و لیستی از هر آنچه را پیدا می کند حفظ می کند) پرس و جو از این فهرست جمع آوری شده و نتایج رتبه بندی می شوند.

دونالد متزلر و همکارانش در تحقیقات گوگل نوشتند: “این طرح برای استخراج شاخص از آن زمان به بعد امتحان کرده است و بندرت مورد چالش قرار گرفته یا مورد بازنگری جدی قرار گرفته است.”

مسئله این است که حتی بهترین موتورهای جستجوگر امروزه نیز به جای خود اطلاعات ، با لیستی از اسناد که شامل اطلاعات درخواستی است پاسخ می دهند. موتورهای جستجو همچنین نمی دانند چگونه به س quالهایی پاسخ دهند که از چندین منبع به پاسخ نیاز دارند. به نظر می رسد از دکتر خود مشاوره خواسته اید و لیستی از مقالات را به جای پاسخ مستقیم ، برای خواندن دریافت کرده اید.

متزلر و همکارانش به یک موتور جستجو علاقه مند هستند که مانند یک متخصص انسانی رفتار می کند. او باید جوابها را به زبان طبیعی ارائه دهد ، که از بیش از یک سند تلفیق شده باشد ، و پاسخهای خود را با ارجاع به شواهد پشتیبان ، همانطور که مقالات ویکی پدیا هدف قرار می دهد ، پشتیبانی کند.

مدل های زبانی عالی ما را بخشی از مسیر آنجا هدایت می کند. GPT-3 که در بیشتر وب و صدها کتاب آموزش دیده است ، از منابع مختلف اطلاعاتی را برای پاسخ به س questionsالات زبان طبیعی تهیه می کند. مسئله این است که او این منابع را دنبال نمی کند و نمی تواند شواهدی برای پاسخ های خود ارائه دهد. هیچ راهی برای دانستن اینکه آیا GPT-3 اطلاعات معتبر یا اطلاعات غلطی را طوطی بازی می کند – یا فقط استفراغ مزخرفاتی را که توسط آن انجام شده است ، وجود ندارد.

متزلر و همکارانش مدلهای زبانی را متنوع می نامند – “تصور می شود که آنها چیزهای زیادی می دانند ، اما دانش آنها عمیق است.” آنها می گویند ، راه حل ایجاد و آموزش آینده BERT و GPT-3 برای ثبت سوابق مکان آنها است. کلمات می آیند هنوز هیچ مدلی وجود ندارد که بتواند این کار را انجام دهد ، اما در اصل این امکان وجود دارد و کارهای اولیه در این راستا وجود دارد.

Ziqi Zhang از دانشگاه شفیلد در انگلیس ، که در حال بازیابی آنلاین اطلاعات است ، می گوید ، چندین دهه پیشرفت در زمینه های مختلف جستجو وجود دارد ، از پاسخ دادن به سوالات گرفته تا جمع بندی اسناد تا ساختار اطلاعات. اما هیچ یک از این فناوری ها تقاضا را تغییر نداده اند ، زیرا هر یک از آنها با مشکلات خاصی سر و کار دارند و قابل تعمیم نیستند. پیش فرض هیجان انگیز این مقاله این است که مدل های بزرگ زبان قادر به انجام همه این کارها همزمان هستند.

با این حال ، ژانگ خاطرنشان می کند که مدل های زبان با موضوعات فنی یا تخصصی عملکرد خوبی ندارند ، زیرا نمونه های کمتری از آنها در متن وجود دارد. وی گفت: “احتمالاً صدها برابر اطلاعات تجارت الکترونیکی در وب بیشتر از مکانیک کوانتوم است.” امروزه مدلهای زبانی نیز به سمت انگلیسی متمایل هستند که باعث می شود قسمتهای غیرانگلیسی شبکه کمتر محو شود.

هنوز هم ژانگ از این ایده استقبال می کند. وی می گوید: “این در گذشته امکان پذیر نبود زیرا مدلهای بزرگ زبان اخیراً به بازار عرضه شده اند.” “اگر کارساز باشد ، تقاضای ما را دگرگون می کند.”


منبع: unbox-khabar.ir

Leave a reply

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>