گوگل بهتازگی ادعا کرده ترجمۀ ماشینیِ جدیدش از ترجمۀ انسانی بهتر است
پیشرفت فناوری بسیاری از حرفهها را محدود و بعضی را بهکلی حذف کرده است. بسیاری از کارهایی که قبلاً انسانها انجامشان میدادند، امروز، بهوسیلۀ دستگاههای پیشرفته انجام میشود. اما آیا روزی خواهد رسید که ترجمۀ ماشینی بهطور کامل جای ترجمۀ انسانی را بگیرد؟ شاید، اما همانطور که آرتور گُلدهمر، مترجم و پژوهشگر سرشناس فرانسوی، میگوید، بعضی پیچیدگیهای زبانی این روند را دشوار کرده است.
آرتور گُلدهمر، ایان — سالها پیش در پروازی از آمستردام به بوستون، دو راهبۀ آمریکایی سمت راست من نشسته بودند و به حرفهای مرد جوانِ خوشصحبتی از اهالی هلند گوش میدادند. مرد جوان قصد داشت ایالات متحده را ازنو کشف کند. او از راهبهها پرسید اهل کجا هستند؟ افسوس که شهر فرامینگهام در ماساچوست جزوِ برنامۀ سفرش نبود؛ اما اعلام کرد که «یه خروار۱ وقت داره و قراره از یه خروار جای مختلف دیدن کنه».
جوان سرخوشِ هلندی بهوضوح این را دریافته بود که «خروار» مترادف جذابی برای «زیادِ» بیرنگوبوست. او علم نحو انگلیسی را بهخوبی فرا گرفته بود و دایرۀ لغات نسبتاً گستردهای هم داشت؛ اما فاقد تجربۀ تناسب کلمات با بافتهای اجتماعی بود.
خبر اخیر، که موتور ترجمۀ گوگل قرار است از سیستم عبارتمحور به شبکۀ عصبی۲ تغییر کند، این خاطره را به ذهنم آورد. تفاوتهای فنیِ این دو در این لینک تشریح شده است. هر دو روش متکی به آموزش ماشین با یک «پیکرۀ متنی» شامل جملههای جفتیاند: جملۀ اصلی و ترجمۀ آن. سپس کامپیوتر، براساس توالی کلمات در متن اصلی، قواعدی برای استنباط محتملترین توالی کلمات در زبان مقصد استخراج میکند.
این روالْ عملی در تطابقِ الگوهاست. زمانی که خطاب به گوشی هوشمندتان میگویید «مرا به بروکلین هدایت کن»، برای تفسیر هجاهای گفتهشده، یا، هنگامی که یک برنامۀ عکس چهرۀ دوستتان را شناسایی میکند و به آن برچسب میزند، از الگوریتمهای تطابقِ الگوی مشابهی استفاده میشود. ماشینْ چهرهها یا مقصدها را «نمیفهمد»؛ آنها را به بُردارهایی از اعداد تقلیل داده و پردازش میکند.
من مترجمی حرفهای هستم و تاکنون حدود ۱۲۵ کتاب از زبان فرانسه ترجمه کردهام. بنابراین ممکن است از من انتظار برود که در برابر ادعای گوگل از کوره در بروم که موتور ترجمۀ جدیدش تقریباً بهخوبی مترجمی انسانی است، زیرا از صفر تا شش، نمرۀ پنج را کسب میکند، درحالیکه میانگین انسانها 5.1 بوده است. اما علاوهبرآن دکترای ریاضی هم دارم و نرمافزاری ساختهام که روزنامههای اروپایی را به چهار زبان مختلف «میخواند» و نتایج را براساس موضوع دستهبندی میکند. پس بهجای اینکه در برابر احتمال جایگزینشدن بامترجم ماشینی موضع دفاعی بگیرم، از قابلیتهای چشمگیر ماشینها آگاه و نسبتبه پیچیدگی و مهارت تکنیکیِ کار گوگل سراپا ستایشم.
اما این ستایش چشمهایم را بر نواقص ترجمۀ ماشینی نمیبندد. مسافر هلندی را به یاد بیاورید که «یه خروار» انگلیسی میدانست. فصاحت مرد جوان نشان میداد که «خیسافزار»۳ یا بهعبارتی شبکۀ عصبی زندۀ او بهخوبی برای درک شهودیِ قواعد ظریف (و استثناها)، که زبان را طبیعی میکنند، آموزش دیده بود. در مقابل، زبانهای کامپیوتری دستورزبانی بدون بافت دارند. اما هلندیِ جوانْ فاقد تجربۀ اجتماعی از زبان انگلیسی بود تا قواعدِ ظریفتری را درک کند که به انتخاب واژه، لحن و ساختارِ زبانیِ یک بومی شکل میدهند. گویندهای بومی نیز ممکن است، برای دستیافتن به نتیجهای خاص، شکستن این قواعد را انتخاب کند. اگر من به دو نفر راهبه بهجای «جاهای زیادی» میگفتم «یه خروار جا»، حتماً از آن منظوری میداشتم؛ اما مرد هلندی به ورطۀ طنزِ ناخواسته افتاد.
موتور ترجمۀ گوگل با استفاده از پیکرههای متنیِ متفاوت، از منابع خبری گرفته تا ویکیپدیا، «آموزشدیده» است. یگانه سرنخی که موجب پی بردن به بافت یک پیکره میشود، توصیف سادۀ آن پیکره است. استنباطِ تناسب یا عدمتناسبِ واژهای مثل «خروار» از چنین اطلاعاتِ اندکیْ سخت خواهد بود. اگر بنا به ترجمۀ این واژه به فرانسه باشد، ماشین میتواند معادلی مناسب را برای آن در beaucoup یا ۴plusieurs حدس بزند. این معادلها ممکن است معنای گفته را ارائه کنند، اما طنز آن را نه. زیرا این طنز وابسته به واژۀ «خروار» است که از لحاظ اجتماعی نشانهدار است، درحالیکه plusieurs خنثی است. هرچقدر هم که الگوریتم پیچیده باشد، باید به اطلاعات فراهمشده تکیه کند و سرنخها دربارۀ بافت، بهخصوص بافت اجتماعی، برای انتقال از طریق کُد بسیار مشکلاند.
petite phrase در زبان فرانسه را مثال بگیریم. phrase بهانگلیسی میتواند «جمله» یا «عبارت» معنا دهد. وقتی مارسل پروست در رمان در جستوجوی زمان ازدسترفته (۱۹۱۳)، در پارۀ «la petite phrase de Vinteuil’»، از آن در بافتی موسیقایی استفاده میکند، باید «عبارت» ترجمه شود، زیرا «جمله» بیمعناست. ترجمۀ گوگل در برگردانِ آن بسیار خوب عمل میکند (منظور نسخۀ قدیمی عبارتمحور آن است؛ نسخۀ جدید شبکۀ عصبی تا الان تنها برای چینی ماندارین قابلاستفاده است). اگر فقط petite phrase را وارد کنید، به شما «جملۀ کوتاه» را تحویل میدهد. اگر la petite phrase de Vinteuil را وارد کنید (وانتوی نام شخصیتی است که ازقضا آهنگساز است)، به شما «عبارت کوتاه وانتوی» را تحویل میدهد که پژواکی از ترجمههای منتشرشده از اثر پروست است. کمیابی نام «وانتوی» بافت لازم را فراهم میآورد و الگوریتم آماری از آن بهره میگیرد. اما اگر le petite phrase de Sarkozy را وارد کنید، بهجای «متلک سارکوزی» که صحیح است، «عبارت کوتاه سارکوزی» را میپراند، زیرا در بافت سیاسیای که نام رئیسجمهور سابق آن را مینمایاند une petite phrase گفتۀ تندوتیزی است که بهسوی رقیبی سیاسی نشانه رفته است: یک متلک، نه عبارتی موسیقایی. اما نام سارکوزی در چنان تنوعی از جملات پدیدار میشود که موتور آماری از ثبت درست آن در میماند و آنگاه این خطا۵ را با یک اشتباه اصطلاحی تأسفآور همنشین میکند.
درست همانند تلاشهای پیشین برای خلق هوش مصنوعی که سابقۀ آن به روزهای دانشجوییِ من در ام.آی.تی برمیگردد، مسئله این است که هوش بهنحوی باورنکردنی پیچیده است. هوشمندبودن صرفاً توانایی استنباط منطقی از قواعد، یا استنباط آماری از قاعدهمندیها نیست. پیشازآن، شخص باید بداند که کدام قواعد کاربردیاند، هنری که نیازمند آگاهیداشتن از حساسیت به موقعیت است. برنامهنویسها بسیار باهوشاند، اما هنوز آنقدر باهوش نیستند که تنوع گستردۀ بافتهایِ حاملِ معنا را پیشبینی کنند. درنتیجه حتی بهترین الگوریتمها نیز نکاتی را از دست میدهند و، همانطور که هنری جیمز گفته، مترجم ایدئال کسی است که «هیچ نکتهای از دستش در نرود».
نمیگویم که ترجمۀ مکانیکی سودمند نیست. مقدار زیادی از کارِ ترجمهْ تکراری است. گاهی اوقات ماشینها از عهدۀ انجامِ کاری بسنده برمیآیند. اما نباید انتظار معجزه، ترجمههای ادبی شایسته یا ارائۀ مناسبِ متلکهای سیاسی را داشت. پژوهشهای مرتبط با هوش مصنوعی، از همان روزهای آغازین، زیر سایۀ ادعاهای مغرورانه بودهاند. این را از ترس شغلم نمیگویم: از ترجمه بازنشسته شدهام و این روزها بخشی از وقتم را صرف کدنویسی میکنم.
پینوشتها:
• این مطلب را آرتور گُلدهمر نوشته است و در تاریخ ۲۱ نوامبر ۲۰۱۶ با عنوان «Shitloads and zingers: on the perils of machine translation» در وبسایت ایان منتشر شده است. وبسایت ترجمان در تاریخ ۱۱ دی ۱۳۹۵ این مطلب را با عنوان «آیا گوگل بالاخره میتواند کاروبارِ مترجمان را کساد کند؟» و با ترجمۀ علی امیری منتشر کرده است.
•• آرتور گُلدهمر (Arthur Goldhammer) نویسنده، مترجم، پژوهشگر و نیز نویسندۀ وبلاگی دربارۀ سیاست فرانسه است. وی بیش از ۱۲۰ کتاب را از فرانسه ترجمه کرده که از میان آنها میتوان به دموکراسی در آمریکا (Democracy in America) نوشتۀ توکویل و سرمایه در قرن بیستویکم (Capital in the 21st Century) توماس پیکتی اشاره کرد. گلدهمر یکی از اعضای مرکز مطالعاتِ اروپایی هاروارد است و یادداشتهای او در نشریاتی چون امریکن پراسپکت و نیشن منتشر میشوند.
[۱] Shitload: این کلمه کاربرد عامیانه و بار معنایی توهین آمیز دارد و به خاطر همین استفاده اش توسط آن هلندی در آنجا مناسب نبوده است.
Neural network [۲]: سیستمی کامپیوتری که براساس مغز انسان و دستگاه عصبی پایهریزی شده است.
Wetware [۳]
[۴] هر دوی اینها در زبان فرانسه بهمعنای بسیار هستند.
Error [۵]: در زبانشناسی کاربردی، خطا انحرافی از قواعد پذیرفتهشدۀ یک زبان است که کسانی که در حال یادگیری آن بهعنوان زبان دوم هستند مرتکب میشوند.
برای اینکه خوانندۀ خوبی باشید، نیازی نیست هر کتابی را تا آخر بخوانید
چطور انگیزۀ انتقامجویی در میان یهودیان اسرائیلی از نازیها به اعراب فلسطینی منتقل شد؟
رمان مدار زمین ما را به زندگی روزمره و خیالانگیز شش فضانورد دعوت میکند
چرا برای توصیف روابط انسانی از استعارههای مکانی و معماری استفاده میکنیم؟
لینک جدیدی نیست.. همون لینک قبلی و ظاهر قدیمی خودشه! به تازگی سیستم هوش مصنوعی مترجمش رو پیشرفتهتر کرده که اونم برای برگرداندن به زبان انگلیسی هست و برای زبانهای غیر فرمت ANSI تا خیلی سال دیگه هم گوگل نمیتونه ترجمه رو روان انجام بده. این اپ جدید هم زده Allo بیشتر از هر چیز دیگهای، بهرههای اطلاعاتی میگیره و یکی از مهمترین دستاوردهاش هم درک مکالمات بین کاربرهاست. نکته دیگه اینکه گوگل بدیهتا به زودی به پردازندههای کوانتومی دسترسی پیدا خواهد کرد و تمام این مشکلات رفع خواهد شد و الان بزرگترین چالشی که در میانه راهش هست دسترسی به نحوه گویش آدمهاست که مثلا الان از Allo استقبال نمیشه و جایی رو نداره که این اطلاعاتش رو چک کنه. جالب هست که بدونیم گوگل با دومیلیارد خط کد یکپارچه و قویترین سیستم امنیتی ممکن، در جهان رتبه یک رو داره.