نوشتار

آیا گوگل بالاخره می‌تواند کاروبارِ مترجمان را کساد ‌کند؟

گوگل به‌تازگی ادعا کرده ترجمۀ ماشینیِ جدیدش از ترجمۀ انسانی بهتر است

پیشرفت فناوری بسیاری از حرفه‌ها را محدود و بعضی را به‌کلی حذف کرده است. بسیاری از کارهایی که قبلاً انسان‌ها انجامشان می‌دادند، امروز، به‌وسیلۀ دستگاه‌های پیشرفته انجام می‌شود. اما آیا روزی خواهد رسید که ترجمۀ ماشینی به‌طور کامل جای ترجمۀ انسانی را بگیرد؟ شاید، اما همان‌طور که آرتور گُلدهمر، مترجم و پژوهشگر سرشناس فرانسوی، می‌گوید، بعضی پیچیدگی‌های زبانی این روند را دشوار کرده است.

آرتور گُلدهمر

Shitloads and zingers: on the perils of machine translation

مترجم: علی امیــری

8 دقیقه

آرتور گُلدهمر

Shitloads and zingers: on the perils of machine translation

مترجم: علی امیــری

8 دقیقه

آرتور گُلدهمر، ایان — سال‌ها پیش در پروازی از آمستردام به بوستون، دو راهبۀ آمریکایی سمت راست من نشسته بودند و به حرف‌های مرد جوانِ خوش‌صحبتی از اهالی هلند گوش می‌دادند. مرد جوان قصد داشت ایالات متحده را ازنو کشف کند. او از راهبه‌ها پرسید اهل کجا هستند؟ افسوس که شهر فرامینگهام در ماساچوست جزوِ برنامۀ سفرش نبود؛ اما اعلام کرد که «یه خروار^۱ وقت داره و قراره از یه خروار جای مختلف دیدن کنه».

جوان سرخوشِ هلندی به‌وضوح این را دریافته بود که «خروار» مترادف جذابی برای «زیادِ» بی‌رنگ‌وبوست. او علم نحو انگلیسی را به‌خوبی فرا گرفته بود و دایرۀ لغات نسبتاً گسترده‌ای هم داشت؛ اما فاقد تجربۀ تناسب کلمات با بافت‌های اجتماعی بود.

خبر اخیر، که موتور ترجمۀ گوگل قرار است از سیستم عبارت‌محور به شبکۀ عصبی^۲ تغییر کند، این خاطره را به ذهنم آورد. تفاوت‌های فنیِ این دو در این لینک تشریح شده است. هر دو روش متکی به آموزش ماشین با یک «پیکرۀ متنی» شامل جمله‌های جفتی‌اند: جملۀ اصلی و ترجمۀ آن. سپس کامپیوتر، براساس توالی کلمات در متن اصلی، قواعدی برای استنباط محتمل‌ترین توالی کلمات در زبان مقصد استخراج می‌کند.

این روالْ عملی در تطابقِ الگوهاست. زمانی که خطاب به گوشی هوشمندتان می‌گویید «مرا به بروکلین هدایت کن»، برای تفسیر هجاهای گفته‌شده، یا، هنگامی که یک برنامۀ عکس چهرۀ دوستتان را شناسایی می‌کند و به آن برچسب می‌زند، از الگوریتم‌های تطابقِ الگوی مشابهی استفاده می‌شود. ماشینْ چهره‌ها یا مقصدها را «نمی‌فهمد»؛ آن‌ها را به بُردارهایی از اعداد تقلیل داده و پردازش می‌کند.

من مترجمی حرفه‌ای هستم و تاکنون حدود ۱۲۵ کتاب از زبان فرانسه ترجمه کرده‌ام. بنابراین ممکن است از من انتظار برود که در برابر ادعای گوگل از کوره در بروم که موتور ترجمۀ جدیدش تقریباً به‌خوبی مترجمی انسانی است، زیرا از صفر تا شش، نمرۀ پنج را کسب می‌کند، درحالی‌که میانگین انسان‌ها 5.1 بوده است. اما علاوه‌برآن دکترای ریاضی هم دارم و نرم‌افزاری ساخته‌ام که روزنامه‌های اروپایی را به چهار زبان مختلف «می‌خواند» و نتایج را براساس موضوع دسته‌بندی می‌کند. پس به‌جای اینکه در برابر احتمال جایگزین‌شدن بامترجم ماشینی موضع دفاعی بگیرم، از قابلیت‌های چشمگیر ماشین‌ها آگاه و نسبت‌به پیچیدگی و مهارت تکنیکیِ کار گوگل سراپا ستایشم.

اما این ستایش چشم‌هایم را بر نواقص ترجمۀ ماشینی نمی‌بندد. مسافر هلندی را به یاد بیاورید که «یه خروار» انگلیسی می‌دانست. فصاحت مرد جوان نشان می‌داد که «خیس‌افزار»^۳ یا به‌عبارتی شبکۀ عصبی زندۀ او به‌خوبی برای درک شهودیِ قواعد ظریف (و استثناها)، که زبان را طبیعی می‌کنند، آموزش دیده بود. در مقابل، زبان‌های کامپیوتری دستورزبانی بدون بافت دارند. اما هلندیِ جوانْ فاقد تجربۀ اجتماعی از زبان انگلیسی بود تا قواعدِ ظریف‌تری را درک کند که به انتخاب واژه، لحن و ساختارِ زبانیِ یک بومی شکل می‌دهند. گوینده‌ای بومی نیز ممکن است، برای دست‌یافتن به نتیجه‌ای خاص، شکستن این قواعد را انتخاب کند. اگر من به دو نفر راهبه به‌جای «جاهای زیادی» می‌گفتم «یه خروار جا»، حتماً از آن منظوری می‌داشتم؛ اما مرد هلندی به ورطۀ طنزِ ناخواسته افتاد.

موتور ترجمۀ گوگل با استفاده از پیکره‌های متنیِ متفاوت، از منابع خبری گرفته تا ویکیپدیا، «آموزش‌دیده» است. یگانه سرنخی که موجب پی بردن به بافت یک پیکره می‌شود، توصیف سادۀ آن پیکره است. استنباطِ تناسب یا عدم‌تناسبِ واژه‌ای مثل «خروار» از چنین اطلاعاتِ اندکیْ سخت خواهد بود. اگر بنا به ترجمۀ این واژه به فرانسه باشد، ماشین می‌تواند معادلی مناسب را برای آن در beaucoup یا ^۴plusieurs حدس بزند. این معادل‌ها ممکن است معنای گفته را ارائه کنند، اما طنز آن را نه. زیرا این طنز وابسته به واژۀ «خروار» است که از لحاظ اجتماعی نشانه‌دار است، درحالی‌که plusieurs خنثی است. هرچقدر هم که الگوریتم پیچیده باشد، باید به اطلاعات فراهم‌شده تکیه کند و سرنخ‌ها دربارۀ بافت، به‌خصوص بافت اجتماعی، برای انتقال از طریق کُد بسیار مشکل‌اند.

petite phrase در زبان فرانسه را مثال بگیریم. phrase به‌انگلیسی می‌تواند «جمله» یا «عبارت» معنا دهد. وقتی مارسل پروست در رمان در جست‌وجوی زمان ازدست‌رفته (۱۹۱۳)، در پارۀ «la petite phrase de Vinteuil’»، از آن در بافتی موسیقایی استفاده می‌کند، باید «عبارت» ترجمه شود، زیرا «جمله» بی‌معناست. ترجمۀ گوگل در برگردانِ آن بسیار خوب عمل می‌کند (منظور نسخۀ قدیمی عبارت‌محور آن است؛ نسخۀ جدید شبکۀ عصبی تا الان تنها برای چینی ماندارین قابل‌استفاده است). اگر فقط petite phrase را وارد کنید، به شما «جملۀ کوتاه» را تحویل می‌دهد. اگر la petite phrase de Vinteuil را وارد کنید (وانتوی نام شخصیتی است که ازقضا آهنگ‌ساز است)، به شما «عبارت کوتاه وانتوی» را تحویل می‌دهد که پژواکی از ترجمه‌های منتشرشده از اثر پروست است. کمیابی نام «وانتوی» بافت لازم را فراهم می‌آورد و الگوریتم آماری از آن بهره می‌گیرد. اما اگر le petite phrase de Sarkozy را وارد کنید، به‌جای «متلک سارکوزی» که صحیح است، «عبارت کوتاه سارکوزی» را می‌پراند، زیرا در بافت سیاسی‌ای که نام رئیس‌جمهور سابق آن را می‌نمایاند une petite phrase گفتۀ تندوتیزی است که به‌سوی رقیبی سیاسی نشانه رفته است: یک متلک، نه عبارتی موسیقایی. اما نام سارکوزی در چنان تنوعی از جملات پدیدار می‌شود که موتور آماری از ثبت درست آن در می‌ماند و آنگاه این خطا^۵ را با یک اشتباه اصطلاحی تأسف‌آور همنشین می‌کند.

درست همانند تلاش‌های پیشین برای خلق هوش مصنوعی که سابقۀ آن به روزهای دانشجوییِ من در ام.‌آی.‌تی برمی‌گردد، مسئله این است که هوش به‌نحوی باورنکردنی پیچیده است. هوشمندبودن صرفاً توانایی استنباط منطقی از قواعد، یا استنباط آماری از قاعده‌مندی‌ها نیست. پیش‌ازآن، شخص باید بداند که کدام قواعد کاربردی‌اند، هنری که نیازمند آگاهی‌داشتن از حساسیت به موقعیت است. برنامه‌نویس‌ها بسیار باهوش‌اند، اما هنوز آن‌قدر باهوش نیستند که تنوع گستردۀ بافت‌هایِ حاملِ معنا را پیش‌بینی کنند. درنتیجه حتی بهترین الگوریتم‌ها نیز نکاتی را از دست می‌دهند و، همان‌طور که هنری جیمز گفته، مترجم ایدئال کسی است که «هیچ نکته‌ای از دستش در نرود».

نمی‌گویم که ترجمۀ مکانیکی سودمند نیست. مقدار زیادی از کارِ ترجمهْ تکراری است. گاهی اوقات ماشین‌ها از عهدۀ انجامِ کاری بسنده برمی‌آیند. اما نباید انتظار معجزه، ترجمه‌های ادبی شایسته یا ارائۀ مناسبِ متلک‌های سیاسی را داشت. پژوهش‌های مرتبط با هوش مصنوعی، از همان روزهای آغازین، زیر سایۀ ادعاهای مغرورانه بوده‌اند. این را از ترس شغلم نمی‌گویم: از ترجمه بازنشسته شده‌ام و این روزها بخشی از وقتم را صرف کدنویسی می‌کنم.

پی‌نوشت‌ها:
• این مطلب را آرتور گُلدهمر نوشته است و در تاریخ ۲۱ نوامبر ۲۰۱۶ با عنوان «Shitloads and zingers: on the perils of machine translation» در وب‌سایت ایان منتشر شده است. وب‌سایت ترجمان در تاریخ ۱۱ دی ۱۳۹۵ این مطلب را با عنوان «آیا گوگل بالاخره می‌تواند کاروبارِ مترجمان را کساد ‌کند؟» و با ترجمۀ علی امیری منتشر کرده است.
•• آرتور گُلدهمر (Arthur Goldhammer) نویسنده، مترجم، پژوهشگر و نیز نویسندۀ وبلاگی دربارۀ سیاست فرانسه است. وی بیش از ۱۲۰ کتاب را از فرانسه ترجمه کرده که از میان آن‌ها می‌توان به دموکراسی در آمریکا (Democracy in America) نوشتۀ توکویل و سرمایه در قرن بیست‌ویکم (Capital in the 21st Century) توماس پیکتی اشاره کرد. گلدهمر یکی از اعضای مرکز مطالعاتِ اروپایی هاروارد است و یادداشت‌های او در نشریاتی چون امریکن پراسپکت و نیشن منتشر می‌شوند.
[۱] Shitload: این کلمه کاربرد عامیانه و بار معنایی توهین آمیز دارد و به خاطر همین استفاده اش توسط آن هلندی در آنجا مناسب نبوده است.
Neural network [۲]: سیستمی کامپیوتری که براساس مغز انسان و دستگاه عصبی پایه‌ریزی شده است.
Wetware [۳]
[۴] هر دوی این‌ها در زبان فرانسه به‌معنای بسیار هستند.
Error [۵]: در زبان‌شناسی کاربردی، خطا انحرافی از قواعد پذیرفته‌شدۀ یک زبان است که کسانی که در حال یادگیری آن به‌عنوان زبان دوم هستند مرتکب می‌شوند.