الذكاء الاصطناعي في متاهة الترجمة إلى العربية

المبرمج والباحث اللغوي العراقي عدنان عيدان يؤكد أن استخدام المدوّنات باللغة العربية للجمل الطويلة تجعل الذكاء الاصطناعي غير قادر على استنباط قواعد منها.
الأحد 2018/12/16
ترجمة فورية يمكن أن تحمل مفاجآت طريفة

تتباين آراء الخبراء في الآفاق التي يمكن أن يفتحها الذكاء الاصطناعي في تطوير الترجمة الآلية إلى اللغة العربية، لكنهم يجمعون على أن الطريق مازال طويلا، ليس بسبب تعقيدات قواعد اللغة العربية، بل بسبب فوضى إرث البيانات والمدوّنات التي يستند إليها لاستنتاج خلاصات دقيقة.

لندن - أصبح مصطلح غوغل ترانسليت أي ترجمة غوغل شائعا في الأوساط العربية وخاصة الثقافية، للتندر من الهفوات الكبيرة في بعض نصوص المترجمين والإشارة إلى أن الترجمة الآلية تنقصها الدقة ولا تزال بعيدة عن فهم المحركات العميقة في اللغة العربية.

ولا يستهدف المصطلح السخرية من موقع غوغل حصرا، بل يقصد به جميع الترجمات الآلية. ويأتي ارتباطه بمحرك البحث العملاق فقط لأن ترجمة غوغل هي الأوسع انتشارا وربما الوحيدة المتاحة مجانا بحسب معظم المحللين.

هناك العديد من برامج الترجمة الآلية بين لغات العالم. وتتباين الآراء بشأن دقتها وآفاقها المستقبلية، التي تعتمد في نهاية الأمر على جودة البيانات المتاحة ودقة قواعدها وعرضها، لكن حظوظ اللغة العربية لا تزال ضعيفة.

وتكاد تكون ترجمة غوغل هي الوحيدة المتاحة مجانا في الوقت الحاضر بعد أن قوضت انتشارها جدوى أنظمة أخرى مثل محرك بحث بينغ التابع لشركة مايكروسوفت الأميركية.

وهناك أعداد هائلة من المواقع الإلكترونية والتطبيقات، التي تتيح الترجمة الفورية للنصوص والمحادثات الصوتية، لكن معظمها وربما جميعها يعتمد على ترجمة غوغل. وتوفر ترجمة المحادثات الصوتية الكثير من الطرائف والمفاجآت الساخرة.

ميزة ترجمة “المسبار” أنها تستند بالدرجة الأولى على طريقة تصميم القاموس العام للنظام، وكذلك على محتواه اللغوي من الكلمة المفردة حتى المصطلح المتعدد الكلمات

ويجمع الخبراء على أن الطريق لا يزال طويلا لبلوغ درجات عالية من الدقة حتى باستخدام الذكاء الاصطناعي، حيث يعتمد الأمر على حجم البيانات المتاحة بكل لغة ومدى دقة قواعد تدوينها وصولا إلى التنقيط والفواصل.

كما أن أقصى ما يمكن أن نطمح إليه هو ترجمة التقارير والبحوث العلمية والإدارية، في حين تبقى ترجمة النصوص الأدبية بطريقة آلية مستبعدا جدا.

وتقدمت اللغة العربية بشكل سريع في السنوات الماضية في قائمة حجم البيانات المتاحة لتصل إلى المرتبة العاشرة بين لغات العالم. لكن معظمها مليء بالأخطاء اللغوية والإملائية، ما يجعل من الصعب الاعتماد عليها في بناء نظام للترجمة الآلية.

وولدت الترجمة الآلية إلى اللغة العربية قبل نحو 24 عاما، حين عرضت شركة أي.تي.أي، التي أسسها المبرمج والباحث اللغوي العراقي عدنان عيدان، أول نظام للترجمة الآلية من اللغة الإنكليزية في معرض جايتكس في دبي عام 1994.

وقال عيدان لـ”العرب” إن الترجمة الآلية بين اللغات التي تنتمي إلى عائلة واحدة مثل اللغات ذات الأصول اللاتينية أو السلافية يمكن أن تحرز تقدّما أكبر من الترجمة بين لغات متباعدة في الأصول والقواعد وبناء الجمل.

وأضاف أن الدقة تعتمد على حجم الإرث المدوّن بلغة سليمة ومدى رسوخ المصطلحات والصياغات العلمية الدقيقة وحتى مدى شيوع استخدام النقاط والفواصل تلك اللغات. وأشار إلى أن اللغات الأوروبية لديها الرصيد الأكبر في هذا المجال.

وقال إن دروب قواعد اللغة مثل التأنيث والتذكير والضمائر وقواعد الصرف ليست هي المشكلة، بل إنها يمكن أن تعزز الدقة. وأشار إلى أن الصعوبة تكمُن في عدم رسوخ قواعد واضحة وقواسم مشتركة تعطي خلاصات واضحة لكتلة البيانات.

وذكر على سبيل المثال أن الكثير من المدوّنات باللغة العربية تستخدم جملا طويلة تصل إلى المئات من الكلمات دون نقطة أو فاصلة وهي مليئة أحيانا. وتساءل؛ إذا كان الباحث المتخصّص يجد صعوبة في فهم معنى تلك المدوّنات فكيف يمكن للذكاء الاصطناعي استنباط قواعد منها.

عدنان عيدان: الترجمة الآلية تعتمد على حجم الإرث المدون بلغة سليمة ومصلحات وصياغات دقيقة
عدنان عيدان: الترجمة الآلية تعتمد على حجم الإرث المدون بلغة سليمة ومصلحات وصياغات دقيقة

وأكد عيدان أن شركة أي.تي.أي تواصل تعزيز دقة ترجمة “المسبار” الآلية، وأن لديها قاعدة اشتراكات مدفوعة، خاصة من الشركات التي تفضّل الحفاظ على الخصوصية وتفادي تسرّب البيانات ودرجة أعلى من الدقة، على اللجوء إلى ترجمة غوغل المجانية.

وذكر أن الشركة تلقت عروضا كثيرة للاستحواذ عليها، لكنها رفضت ذلك لأسباب أمتنع عن ذكرها. وأقر بأن الطريق لا يزال طويلا لبلوغ دقة عالية لا تقل عن نسبة 95 بالمئة. لكن الشركة مصرّة على مواصلة السعي إلى بلوغ ذلك الهدف.

وأوضح أن ميزة ترجمة “المسبار” أنها تستند بالدرجة الأولى على طريقة تصميم القاموس العام للنظام، وكذلك على محتواه اللغوي من الكلمة المفردة حتى المصطلح المتعدد الكلمات.

وأشار إلى أنه كلما تضمّن القاموس المزيد من الكلمات والمزيد من المصطلحات بلغة المصدر الإنكليزية وكذلك نوعية المقابلات العربية لمفردات القاموس العام، كلما سهل الأمر على بقية مكوّنات النظام في فهم المعاني وقواعد اللغة وتحليل النص المترجم من أجل إعطاء ترجمة عربية ذات نوعية عالية.

وقال إن الذكاء الاصطناعي يمكن أن يحدث طفرة هائلة في الترجمة الآلية في الكثير من اللغات، لكن ذلك لا ينطبق كثيرا على اللغة العربية لأنها لم تُدرس وتعالج معالجة كمبيوترية من كلّ جوانبها وهذا يعبّر عن عجز شبه تام في المؤسسات البحثية في العالم العربي.

وأكد المختص العراقي أن نظام أي.تي.أي يركز على وضع نظام متكامل من اللبنات الأولى وحتى أعلى الدرجات في سلم التطوّر في نظام برمجيات الترجمة الآلية، وهو لا يستند الاحتمالات والطرق الإحصائية العشوائية.

17