مجلة شهرية - العدد (572)  | مايو 2024 م- ذو القعدة 1445 هـ

الذكاء الاصطناعي.. والترجمة والكأس المقدسة لـ(اللغة الطبيعية)

اقترح دوغلاس إيك إذ سئل عن الطفرات التي طرأت على إدارة اللغات باستخدام الذكاء الاصطناعي الضغط على زر (ترجمة) على تطبيق Meet لخدمة المؤتمرات المرئية المستخدم في المقابلة الشخصية لمناقشة جائحة فيروس كورونا المستجد. وحينئذ عرضت كلمات المهندس الأمريكي الذي قدم إلى باريس للعمل في مقر شركة جوجل الفرنسي مكتوبة مباشرة ودون خطأ تحت النافذة التي نراه فيها مرتدياً سماعة رأسه. وهذا الابتكار الذي لم يتخيله أحد حتى وقت قريب متاح أيضاً لغالبية مقاطع الفيديو الموجودة على موقع يوتيوب المملوك لشركة جوجل، أو على جهاز الإملاء لأحدث هواتف الشركة الذي يعرض خدمة كتابة جميع التسجيلات الصوتية.
وهذه الإمكانات الجديدة ما هي إلا مثال واحد فقط على التطور الذي أحرزته الشركات الرقمية في السنوات الأخيرة في مجال معالجة اللغات الطبيعية، وبخاصة الشركات العملاقة مثل (جوجل) و(آبل) و(فيسبوك) و(أمازون) (GAFA). وبعض هذه الابتكارات قيد الاستخدام بالفعل، والبعض الآخر في مرحلة البحث ويعرض في مؤتمرات المبرمجين السنوية، مثل مؤتمر Google I/O (الذي عقد في الفترة ما بين 18 - 20 مايو 2021) ومؤتمر Facebook F8 (الذي انعقد في الثاني من يونيو 2021).
(ينتج الذكاء الاصطناعي 20 مليار ترجمة يومياً على موقع Facebook)
وفي مجال الترجمة البالغ الأهمية، تجعل خدمات الترجمة مثل (ترجمة جوجل) التي تقدم خدمات الترجمة لـ 104 لغات أو منافستها الألمانية DeepL تيسر حالياً ترجمة فقرات كاملة بطريقة سلسة. وبفضل هذه الطفرات، تقدم جوجل خدمة ترجمة مقاطع الفيديو على موقع يوتيوب.
وقد قطعت شركة (فيسبوك) أيضاً شوطاً كبيراً. فالذكاء الاصطناعي لديها ينتج 20 مليار ترجمة يومياً على شبكتها الاجتماعية (بعشرات اللغات، بما في ذلك اللغة الولوفية السنغالية) مقارنة بستة مليارات فقط عام 2019.
وقال يان ليكون، كبير علماء الذكاء الاصطناعي في شركة فيسبوك ورائد من رواد هذا المجال: (هذا المجال بالغ الأهمية لشركة فيسبوك، وإننا نعلم أن الترجمات الفورية ستكون ممكنة ذات يوم).
إن حلم الترجمة الآلية لمحادثات حية في المتناول. وقد دنت خدمة (ترجمة جوجل) من تحقيق هذا الحلم، ولو أنها تأخرت قليلاً: فيمكنك أن تتحدث بلغة فيسمع الطرف الآخر أو يقرأ الترجمة عبر هاتف ذكي، بل ويسمع حتى رده المترجم عبر سماعة رأسه لو كان يرتدي أحدث سماعات الرأس على الإطلاق.
إن الحواجز الفاصلة بين النص والصورة تتلاشى حالياً، فباستخدام تطبيق الواقع المعزز Google Lens، يستطيع الطلاب مسح صفحة من كتاب أكاديمي أو جملة مكتوبة بخط اليد بهواتفهم الذكية وترجمتها أو الحصول على معلومات إضافية عنها من شبكة الإنترنت. وبوسع السائح أن يفهم لافتة في الشارع أو قائمة طعام أو يحصل على معلومات عن نصب تذكاري.
وكل ذلك يرجع إلى أن البرمجيات تعلمت كيف تتعرف على الأشياء الموجودة في الصور. وغداً، سيكون بوسعنا أن نبدأ بحثاً بالصور، هكذا تعتقد شركة جوجل. وتستكشف شركة OpenAI الأمريكية فكرة إنشاء صور من وصف نصي. وأول تطبيق أولي لها، ويعرف باسم DALL-E، يقدم تمثيلات مثيرة للقلق لأشياء مبتكرة: ساعة منبهة على هيئة ثمرة دراق ومصباح على شكل خنزير.
تساعد هذه الابتكارات على تيسير التقنية الرقمية بقدر أكبر من ذي قبل للمعاقين والأميين. وتدرس شركة (فيسبوك) بالتعاون مع المعهد الوطني الفرنسي للبحوث في مجال المعلوماتية والآلية (إنريا) فكرة تبسيط الأشكال باستخدام الرسوم التخطيطية والمترادفات. وفي يناير، قدمت الشركة أداة للوصف الآلي للصور للمكفوفين وضعاف البصر. ولدى شركة (جوجل) مشروع للتعرف على الصوت يستهدف الذين يعانون من مشكلات الكلام يعرف باسم (يوفونيا) (Euphonia).
والآن، يرصد الذكاء الاصطناعي جملاً أكثر تعقيداً من ذي قبل بكثير. وتزعم شركة (أمازون) أن مساعدها الصوتي (أليكسا) تعلم بحلول عام 2020 فهم تنويعات أكثر للحوارات البسيطة، وطرح أسئلة عن كلمات مجهولة، بل والتنبؤ بـ(نوايا) المستخدم واقتراح مقياس وقتي إذا سأل عن وقت إعداد الشاي. ويجيب محرك بحث جوجل عن أسئلة مثل: (من أين ينبع نهر السين؟) أو (إلى أي حزب سياسي تنتمي صحيفة ليبراسيون الفرنسية؟).
يقول باندو ناياك نائب رئيس قسم البحث في شركة جوجل: (سيكون بوسعنا على المدى البعيد التعامل مع استفسارات تشمل نوايا معقدة). على سبيل المثال: (تسلقت جبل آدامز بالفعل، وأود أن أتسلق جبل فوجي. فكيف أعد العدة لذلك؟). يمكن أن تنقسم الإجابة إلى استفسارين، على أن تلحق بهما روابط لأدلة تدريبية أو معدات تسلق الجبال أو خرائط أو مقاطع فيديو أو محتوى مترجم من اليابانية، ولو أن هذا العمل ما زال (في مرحلة التصور إلى حد كبير).
لقد مكنت الطفرات العلمية الأخيرة في مجال تعلم الآلة أو التعلم العميق موجة الابتكارات هذه. وتنافس هذه التقنية البشر في لعبة Go أو في التعرف على الصور. ومبدأها التكيف مع مليارات معايير برنامج ما لاقتراح أفضل صلة بين مجموعة معلومة من (الأسئلة) و(الإجابات). وفي عام 2017، ابتكرت شركة جوجل طريقة جديدة لتنظيم تلك التقنية لتحسين الترجمات الآلية. وإذ عرفت تلك التقنية باسم (المتحول) (Transformer)، سرعان ما تبنتها شركة فيسبوك وشركة بايدو الصينية وشركة (سيسترانس) الفرنسية-الأمريكية وشركة (DeepL) الألمانية.
وقال ديفيد إيك المهندس في شركة جوجل: (المرة الأخيرة التي حدثت فيها طفرة كهذه كانت منذ خمس سنوات، حين ابتكرت هياكل الشبكة العصبية المتكررة (LSTM) المستخدمة في المساعدات الصوتية). في عام 2018، أضيف (التعلم ذاتي الإشراف) إلى هذه الطفرة، إذ أثبتت شركة جوجل أن برنامج (Transformer) يستطيع الاستغناء عن الإشراف البشري لـ(تعلم) لغة ما. ولكن، إلى الآن ما زال البرنامج بحاجة إلى قواعد بيانات ضخمة مزودة بشروح بشرية كي يعثر على القيمة الصحيحة لمعاملات البرنامج.
وقد ثبت أن النظام المعروف باسم (BERT) (اختصاراً لتمثيلات مشفر ثنائية الاتجاه من البرامج التحويلية) و(يتعلم) التعبئة مكان الجمل الخالية ممتاز في التعامل مع تمارين النحو والأسئلة والإجابات. كما ألهم نظام شركة فيسبوك المعروف باسم (روبرتا)، ومن بعده نظام GPT-3 لشركة OpenAI بمعاملاته البالغ عددها 15 ملياراً و500 مليار كلمة (وهو بذلك أكبر 100 مرة من النسخة الإنجليزية لموقع ويكيبيديا)، وأخيراً النظام الصيني (Wu Dao 2.0) الأكبر حجماً 10 مرات.
يقول توماس وولف المؤسس المشارك لشركة (هاجينج فيس) المتخصصة في توزيع هذه النماذج: (سنحتاج نماذج اللغات هذه بشكل متزايد لنتلمس طريقنا إذ نتصدى إلى كم كبير من المعلومات والنصوص).
إن التوقعات واعدة، لكنها أيضاً مربكة لأن هذه التقنيات ستستخدم في سماعات الرأس والمنازل والسيارات. وقد جمعت المخاوف التي تجول في خاطر البعض في مقالة شاركت في كتابتها تيمنيت جيبرو ومارغريت ميتشل، الباحثتان في ميدان الأخلاقيات، اللتان تسبب طرد شركة جوجل لهما في جدل كبير. والشاغل الأهم يتعلق بـ(التحيزات) -العرقية والجنسية والمعادية للمثليين- التي يمكن أن تستنسخها هذه البرمجيات، أو حتى تضاعف أثرها، بعد التدريب على كميات مهولة من النصوص من شبكة الإنترنت.
على سبيل المثال، يمكن أن تجنح برامج الدردشة الآلية إلى أفكار المؤامرة. ورداً على ذلك، أعلنت شركة جوجل أنها تستبعد الأجزاء (المسيئة) من شبكة الإنترنت، كمنتديات بعينها، من بياناتها التدريبية. يقول إيك: (بالتزامن مع نمو هذه النظم، تناط بنا مسؤولية أن نضمن أن تبقى منصفة وعادلة). ولو أنه يفضل أن يبحث عن الحلول على أساس (كل حالة بمعزل عن غيرها من الحالات) وفقاً للاستخدام، بدلاً من أن يحاول تصحيح التحيزات كلها الموجودة في مجموعات البيانات. وتود شركات أخرى، من بينها شركة Big Science الدولية، استخدام محتوى نصي أفضل توثيقاً وأقل تحيزاً.
(الشاغل الأبرز على الإطلاق يتعلق بـ(التحيزات) -العنصرية والجنسية والمعادية للمثلية- التي يمكن أن تستنسخها تلك البرمجيات).
ومن بين القيود الأخرى التي تقيد مثل هذه البرمجيات تركيزها على اللغات الأكثر شيوعاً على شبكة الإنترنت، مما يجعلها أقل فعالية في التعاطي مع اللغات (ذات الموارد المحدودة)، نظراً لقصور بيانات التدريب الخاصة بها. وتحاول الشركات الرقمية العملاقة التخفيف من حدة اختلال التوازن هذا. ففي أكتوبر عام 2020، قدمت شركة (فيسبوك) برنامجاً قادراً على ترجمة 100 لغة دون المرور بالإنجليزية كلغة وسيطة، وهو الأمر الإلزامي حالياً.
إن (نماذج اللغة الكبيرة) أيضاً مستهجنة بسبب ضخامتها. توضح جيبرو وميتشل الخطورة البيئية المتعلقة باستهلاك الطاقة الذي ينطوي عليه استخدام هذه النماذج، حتى لو كانت الأرقام محل خلاف. ويقول مؤلفا المقال اللذان يصفان البرامج الحالية بـ(الببغاوات العشوائية): إن الاستثمارات ينبغي أن تضخ في نماذج أقل اعتماداً على البيانات الكثيفة.
ويوافق الجميع على أن هذه النظم لا (تفهم) اللغة بحق. يقول يان ليكون كبير علماء الذكاء الاصطناعي في شركة فيسبوك والباحث عن سبل للتطوير: (أحياناً ما تكون النتائج مخادعة، لكننا نرى أن النصوص المتولدة ينتهي بها الأمر إلى أن تحتوي على أخطاء من السهل اكتشافها. وهذه النظم لا تتمتع بمنطق سليم أو معرفة بالعالم، على عكس الأطفال).
في الوقت الراهن، سيصاحب النمو المبهر للغات بمساعدة الحاسوب أسئلة متزايدة. وستنضم إلى النقاشات الجارية حول قضايا اجتماعية - كمسألة ما إذا كان الأطفال سيواصلون تعلم اللغات الأجنبية - نقاشات قانونية وتنظيمية. وسيتعين الأمر جعل هذه البرمجيات - كأي لوغاريتم معقد - أكثر شفافية وقابلية للفهم. ويمكننا أن نتنبأ بالأسئلة المتعلقة بالمسؤولية في حالة وقوع خطأ، إذ أشارت جيبرو إلى أن فلسطينياً اعتقل بسبب خطأ في الترجمة في تدوينة على موقع فيسبوك.
ومن الممكن أن يقيد الضبط الآلي للمحتوى باستخدام اللوغاريتمات حرية التعبير أيضاً، وهو موضوع مشروعات تشريعية كثيرة. تقترح المفوضية الأوروبية في قوانينها المنظمة للذكاء الاصطناعي التي تبنتها في أبريل الماضي تهيئة إطار العمل وفقاً لمستوى المخاطر التي ينطوي عليها. على سبيل المثال، توصي المفوضية بإعلام مستخدمي شبكة الإنترنت عندما يتحاورون على الشبكة مع برنامج لا مع إنسان.

ذو صلة