گوگل چگونه زبانها را ترجمه مي کند؟
کمپاني IBM سالها پيش ادعا کرده بود که بزودي در اختراع سيستم ترجمه کامپيوتري حرف اول را خواهد زد اما اين گوگل بود که IBM را پس زد و حتي در ترجمه مستقيم و درست زبانهاي عربي و چيني به انگليسي IBM را مغلوب کرد.
گوگل بيش از 200 ميليارد کلمه را با استفاده از هزاران مدرک و متن موجود در سازمان ملل متحد وارد ديتابيسش کرده و با استفاده آماري-مقايسه اي ، نزديکترين و پر استفاده ترين اصطلاحات و جملات را بعنوان ترجمه به کاربران ميدهد. و اين در حاليست که لزومي ندارد که هيچيک از مهندسان و متخصصان قسمت ترجمه گوگل با اين زبانها آشنايي داشته باشند..تمام کارها را ماشين و کامپيوتر عظيم گوگل انجام مي دهد بي آنکه اين ماشين برايش مهم باشد که گرامر چه اهميتي دارد و يا مثلا رابطه راه رفتن و پا چيست.....
سايتهاي AOL, Alta Vista, Babblefish و حتي گوگل از تکنولوژي ترجمه اي شرکت Systran ، استفاده و روزانه تقريبا 25 ميليون صفحه وب ترجمه مي کنند. اما سيستم ترجمه ماشيني گوگل ( MT system ) ، مدارک سازمان ملل را ، مثلا قوانين و سخنرانيها ، به اين دليل استفاده مي کند که در اين سازمان يک متن يا سخنراني بايد هميشه به دهها زبان مختلف به شکل دقيق و هم معنا و قابل فهم ترجمه شوند. بنابرای یکچنین مدل ترجمه ای ، برای کاربر، رایج تر و قابل فهم تر و امروزی تر است چرا که نمایندگان خودش در سازمان ملل هم همین نوع واژه ها و اصطلاحات را بکار می برند و یا مثلا در کتابهای شعر و ادبیات هم بیشتر همین کلمات/اصطلاحات استفاده شده و اینجا دیگر گرامر و دستور زبان ملاک و متراژ اصلی نیستند و ترجمه از آن حالت خشک و رسمی دستور زبانی خارج ، و محاوره ای تر میشود.
فرض کنید که بخواهیم متنی را از انگلیسی به فارسی ترجمه کنیم: اين مدل گوگلي، زبان هدف (یعنی target - زبانی که کاربر میخواهد به آن ترجمه شود ، یعنی فارسی) را بعنوان یکنوع هدف و کد ناشناس فرض می کند و درست مثل اینکه بخواهد آنرا دی کد deCode (رمز گشایی) کند عمل کرده و رایج ترین و پر استفاده شده ترین کلمات و اصطلاحات رایج در هزاران کتاب و متن های آن زبان مورد نظر کاربر را ( که در دیتابیس گوگل ذخیره شده) بارها با يکديگر مقايسه کرده و درين مقايسه ها به بهترين و پر استفاده ترین کلمات و اصطلاحات زبان دوم (هدف) امتياز بيشتري مي دهد ( اسکور score مي دهد و آپتيمايز optimize مي کند) و اینکار را آنقدر ادامه می دهد تا اينکه به يک ترجمه برتر و نهايي برسد و تمام این پروسه فقط چند ثانیه طول می کشد..
نکته جالب اينکه چرا گوگل زبانهاي عربي و چيني (ماندرين) را بعنوان نخستين پروژه ترجمه زبانهايش برگزيد ؟ دکتر مايلز آزبورن Miles Osborne استاد دانشگاه ادينبورگ که روي اين پروژه براي گوگل کار کرده مي گويد که ارتش و اداره امنيت امريکا بخاطر مسايل امنيتي و ضد تروريستي در اين دو منطقه از جهان، نياز فوري به ترجمه از اين دو زبان داشتند و کمک مالي هنگفتي به گوگل درين پروژه کردند تا سريعتر به نتيجه برسد. او مي گويد که دولت امريکا به ترجمه هايي که توسط آدمها و مترجمانش مي شد اطمينان نداشت ولي به ماشين ترجمه گوگل - بخاطر بي نظر بودنش- اعتماد دارد.