شکاف زبان در ایالات متحده یک مشکل فوری برای آمریکایی های آسیایی است


چن می گوید در حالی که سیاست های تعدیل محتوا از طریق فیس بوک ، توییتر و دیگران توانسته اند بارزترین اطلاعات نادرست را به زبان انگلیسی فیلتر کنند ، این سیستم اغلب وقتی این مطالب را به زبان های دیگر دارد از این مطالب صرف نظر می کند. در عوض ، این کار باید توسط داوطلبانی مانند تیم او انجام شود ، آنها به دنبال اطلاعات غلط بودند و برای خنثی سازی و به حداقل رساندن گسترش آن آموزش دیده بودند. وی گفت: “این سازوکارها ، طراحی شده برای به دست آوردن برخی کلمات و چیزهای خاص ، لزوماً این اطلاعات غلط و اطلاعات غلط را هنگامی که به زبانی دیگر باشد ، نمی گیرند.”

سرویس ها و فن آوری های ترجمه گوگل مانند Translatotron و هدفون ترجمه در زمان واقعی از هوش مصنوعی برای تبدیل بین زبان ها استفاده می کنند. اما Xiong این ابزارها را برای Hmong ، زبانی کاملاً پیچیده که در آن زمینه بسیار مهم است ، ناکافی می داند. او می گوید: “من فکر می کنم که ما واقعاً راضی و وابسته به سیستم های پیشرفته ای مانند Google شده ایم.” “آنها ادعا می کنند” به زبان قابل دسترسی “هستند ، سپس من آنها را می خوانم و مطلبی کاملاً متفاوت می نویسم.”

(سخنگوی گوگل اذعان داشت كه ترجمه زبانهای كوچكتر كار دشوارتری است ، اما گفت كه این شركت “با استفاده از یادگیری ماشینی و بازخورد از جامعه” در تحقیقاتی سرمایه گذاری كرده است كه مخصوصاً برای ترجمه زبان های كم منبع مفید است.)

تمام راه پایین

چالش های زبان آنلاین فراتر از ایالات متحده است – و به معنای واقعی کلمه ، به کد اصلی است. یودانجایا ویجراتنه محقق و دانشمند داده در اتاق فکر سریلانکا LIRNEasia است. در سال 2018 ، وی ردیابی شبکه های ربات را شروع کرد که فعالیت آنها در شبکه های اجتماعی خشونت علیه مسلمانان را تشویق می کرد: در فوریه و مارس همان سال ، یک سری آشوب توسط بودایی های سینهالی ، مسلمانان و مساجد شهرهای آمپارا و کندی را هدف قرار داد. تیم وی “منطق شکار” ربات ها را مستند کرد ، صدها هزار پست سینهالی را در رسانه های اجتماعی فهرست بندی کرد و یافته ها را در توییتر و فیس بوک منتشر کرد. وی گفت: “آنها انواع و اقسام چیزهای خوب و خوب را بیان می کنند – عمدتا اظهارات کنسرو شده”. (در بیانیه ای ، توییتر گفت که از سیستم های خودکار بررسی و انسان استفاده می کند تا “بی طرفانه قوانین ما را در مورد همه افراد سرویس ، صرف نظر از منشا ، ایدئولوژی یا موقعیت سیاسی اعمال کند.”)

سخنگوی فیس بوک در گفتگو با MIT Technology Review گفت که این شرکت ارزیابی حقوق بشر مستقل از نقش این سیستم عامل در خشونت در سریلانکا را که در ماه مه سال 2020 منتشر شد ، انجام داده است و از زمان حملات تغییراتی ایجاد کرده است ، از جمله استخدام ده ها نفر ناظران محتوای سینهالی و تامیلی صحبت می کنند. آنها گفتند: “ما برای شناسایی كمك به محتوای بالقوه توهین آمیز و سریعتر و م ،ثر ، فن آوری پیشگیری از گفتار نفرت را در سینهالا مستقر كرده ایم”

“کاری که می توانم با سه خط کد پایتون به زبان انگلیسی انجام دهم به معنای واقعی کلمه دو سال طول کشید تا 28 میلیون کلمه Sinhala را بررسی کنم.”

یودانجایا ویجراته ، لیرنزیا

با ادامه رفتار ربات ، ویجراتن نسبت به اشکالات بدبین شد. وی تصمیم گرفت کتابخانه های کد و ابزارهای نرم افزاری مورد استفاده شرکت ها را بررسی کند و دریافت که مکانیسم های کنترل سخنان نفرت در اکثر زبان های غیر انگلیسی هنوز ایجاد نشده است.

ویگراتن می گوید: “در حقیقت ، بسیاری از تحقیقات مانند بسیاری از ما هنوز انجام نشده است.” “کاری که من می توانم با سه خط کد پایتون به زبان انگلیسی انجام دهم به معنای واقعی کلمه دو سال طول کشید تا 28 میلیون کلمه Sinhala را برای ساختن شرکت های اصلی ، ساخت ابزارهای اساسی و سپس رسیدن به آن سطح بررسی کنم.” تحلیل متن “

پس از اینکه بمب گذاران انتحاری در آوریل 2019 کلیساهای کلمبو ، پایتخت سریلانکا را هدف قرار دادند ، ویجاراتنه ابزاری برای تجزیه و تحلیل سخنان نفرت انگیز و اطلاعات غلط در سینهالا و تامیل ساخت. این سیستم که Watchdog نام دارد ، یک برنامه موبایل رایگان است که اخبار را با هم تلفیق کرده و هشدارها را به داستان های جعلی وصل می کند. هشدارها از طرف داوطلبان آموزش دیده برای تأیید حقایق است.

ویجراتن تأکید می کند که این کار فراتر از ترجمه است.

او می گوید: “بسیاری از الگوریتم هایی که ما مسلم می دانیم و اغلب در تحقیقات ، به ویژه در پردازش زبان طبیعی ذکر می شوند ، نتایج بسیار خوبی برای انگلیسی نشان می دهند.” “با این وجود بسیاری از الگوریتم های یکسان ، حتی در زبانهایی که فقط در چند درجه متفاوت هستند – اعم از آلمانی غربی یا درخت عاشقانه زبانها – مورد استفاده قرار می گیرند – می توانند نتایج کاملاً متفاوتی داشته باشند.”

پردازش زبان طبیعی در قلب سیستم های تعدیل محتوای خودکار است. ویجراتن گزارشی را در سال 2019 منتشر کرد که اختلاف بین صحت آنها را به زبانهای مختلف بررسی می کند. وی استدلال می کند که هرچه منابع محاسباتی بیشتری برای یک زبان وجود داشته باشد ، مانند مجموعه داده ها و صفحات وب ، الگوریتم ها می توانند بهتر کار کنند. زبانهای کشورهای فقیرتر یا جوامع محروم هستند.

“اگر در حال ساختن مثلا ساختمان Empire State برای انگلیسی هستید ، نقشه ها را دارید. شما مواد را دارید. ” “شما همه چیز در دست دارید و تنها کاری که باید انجام دهید این است که این موارد را کنار هم قرار دهید. شما برای هیچ زبان دیگری نقاشی ندارید.

“شما تصوری ندارید که این بتن از کجا تولید می شود. شما هیچ فولادی و کارگری ندارید. بنابراین شما در آنجا خواهید شنید ، و یک آجر را استراق سمع می کنید و امیدوارید که شاید نوه یا نوه شما بتواند پروژه را به اتمام برساند. “

مشکلات ریشه ای عمیق

جنبش تهیه این نقاشی ها به عنوان عدالت زبانی شناخته می شود و موضوع جدیدی نیست. کانون وکلای دادگستری آمریکا عدالت زبانی را “چارچوبی” توصیف می کند که حقوق مردم را برای “برقراری ارتباط ، درک و فهم به زبانی که بیشترین بیان و قدرت را دارند ترجیح می دهند و احساس می کنند” حفظ می کند.


منبع: unbox-khabar.ir

Leave a reply

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>