|   

أتمتة اللغة العربيّة أمام منعطف لبناني- فرنسي

النسخة: الورقية - دولي
آخر تحديث: نعمة نعمة اختصاصي تربوي لبناني 

ما زالت أتمتة اللغة العربيّة Automation، بمعنى صوغ معادلات رياضيّة رقميّة تمكّن الكومبيوتر من «فهمها» بوضوح، مسألة إشكاليّة.

وعلى رغم انقضاء قرابة ربع قرن من الجهود الرامية إلى صنع برامج رقميّة تجعل الكومبيوتر قادراً على أن «يتولى» بنفسه تصريف الأفعال باللغة العربيّة، تكون بمستوى الاتقان والدقة والفعاليّة التي تتمتع بها برامج تصريف الأفعال في لغات كالإنكليزيّة والفرنسيّة وغيرهما.

 

جسر لغوي مختلط

ربما تغيّرت تلك الصورة قريباً بفضل جهود لبنانيّة - فرنسيّة، يبذلها باحثون في الأتمتة والتدقيق الإملائي للغة العربيّة.

وهناك باحثان باتا على مقربة من صنع برنامج كومبيوتر يتولى أوتوماتيكيّاً توليد الأفعال العربيّة وتحليلها، بل وصولاً إلى المعالجة الآليّة للغة العربيّة. ويعمل أحد الباحثين، هو اللبناني- الفرنسي ألكسي عميد نعمة، باحثاً في علوم الألسنيّة ومهندساً في علوم الكومبيوتر، فيما يدير الآخر، هو الفرنسي إيريك لابورت «مختبر غاسبار مونتاني للمعلوماتيّة» Gaspard Montagne Computer Science Laboratory (اختصار الإسم الفرنسي للمختبر هو «إل إي جي إم» LIGM).

وأوضح نعمة أنه بعد ما يزيد على عشرين عاماً من العمل على المعالجة الآليّة للغّة العربيّة، ما زالت العقبات نفسها تعترض التوصّل إلى حلول لثغرات برامج توليد الأفعال والأسماء في اللغّة العربيّة. في المقابل، تتطور المعالجات الآليّة في اللغّات الأجنبيّة بوتيرة كبيرة. إذ جرى نشر ما يزيد على 20 برنامج كومبيوتر لتصريف الأفعال في اللغّة الفرنسيّة.

وشدّد على كون التعقيدات الـ «مورفوفنولوجيّة» للغّة العربيّة، والمتغيّرات الإملائيّة المتّصلة بها، تعتبر من العقبات الكبرى في تحقيق نجاح ملموس في صنع برامج المعالجة الآليّة للعربيّة. ويطلق تعبير «مورفوفنولوجي» على العلاقة بين الشكل الظاهري للحروف وطريقة تجميعها في تركيب كلمات منطوقة. ولاحظ نعمة أن مراكز البحوث العربيّة والعالميّة، لم تتوصّل بعد إلى صوغ برنامج فعّال لتصريف الأفعال، على غرار ما هو حاصل في اللغّات الأوروبيّة.

وبيّن أن معظم تلك المراكز البحثيّة تلجأ إلى سياسة «الهروب الى الأمام». فبدلاً من التصدي لمشكلة عدم قدرتها على حلّ عقدة المرجعيّات المعجميّــــة ووضـــع فـــرضيّات وتشكيلات لغويّة جديدة، تعمد تلك المراكز إلى التقدّم باستمرار، فكأنها تتعامل مع المشكلة بإنكار وجودها أصلاً!

 

بساطة تخلو من الخطأ

في السياق عينه، شرح لابورت وجود مشكلة اخرى تتعلّق بنُظُم الكومبيوتر وبرامجه، بمعنى أنه لم يجرِ تطوير نظام من برامج الكومبيوتر يتناسب مع خصائص اللغة العربيّة. ولفت إلى أن مختبر «إل إي جي إم» لجأ إلى تعديل البنية البرمجيّة للغة الرقميّة المعروفة بإسم «يوني تكس» UNITEX، كي تصير أكثر إستجابة للغة العربيّة. ووفق لابورت، تضمّن ذلك التعديل إضافة ثلاث تحديثات تطاول جذر الفعل، والسوابق واللواحق، والتشكيل الجزئي.

وبيّن لابورت أن تلك الإضافات جعلت نظام «يوني تكس» رافعة أساسيّة في معالجة اللغة العربيّة بواسطة الكومبيوتر.

ويلتقط نعمة الخيط ليوضح أن نتائج استخدام «يوني تكس» في أتمتة اللغة العربيّة، أعطت نتائج عالية الدقّة، مبيّناً أنه استطاع استخدام نظام «يوني تكس» في صنع برنامج لتوليد الأفعال العربيّة وتصريفها (15400 فعل)، ومشيراً إلى ان ذلك البرنامج جاء بسيطاً وسهلاً وخاليّاً من الأخطاء أيضاً. وأضاف أن استعماله نظام «يوني تكس» (مع التعديلات الثلاثة المشار إليها أعلاه)، أدى إلى صنع برنامج كومبيوتر يستطيع تحليل الأفعال العربيّة، مع ملاحظة السوابق واللواحق المتّصلة بالأفعال، وكذلك الحال بالنسية لأشكال التصريف كلها.

وشدّد نعمة على أن البرنامج الذي صنعه لا يعتبر وصولاً إلى «خط النهاية». إذ يعتزم وضع نموذج عن البرنامج بين أيدي المهتمين، كي يحصل على رأيهم وتقويمهم لذلك البرنامج. وأضاف: «نتابع في مختبر «إل إي جي إم» البحوث لإيجاد حلول للمشكلات الأكثر تعقيداً في اللغة العربيّة. إذ اشتغلنا أيضاً على توليد جمع التكسير (3200 مدخل معجمي) وحصلنا على نتائج ممتازة (93000 شكل) في توليد جموع التكسير، والتعرّف على صيغة المفرد التي جاءت منها، إضافة إلى ربطها بعضها بعضاً».

وللتوضيح، تعتبر صيغة جمع التكسير من الصيغ الصعبة في اللغة العربيّة، لأن لا توجد قاعدة تحكمها. فمثلاً، يجمع «رامٍ» تكسيراً بكلمة «رُماة»، و «راكع» بـ «رُكّع» و «حاج» بـ «حجيج»، وواضح أن لا قاعدة للربط بين صيغتي المفرد وجمع التكسير. ومثلاً، يجري الحفاظ على صيغة المفرد في جمع المؤنّث السالم، كأن تجمع «طالبة» بكلمة «طالبات»، وجمع المذكّر السالم فيمكن جمع «جالس» بـ «جالسون».

وعلّق لابورت على الأمر نفسه بالإشارة إلى أن خبراء علوم اللغات مجبرين على التكييف مع نُظُم برامج الكومبيوتر. وأضاف: «يحتاج توليد مورد تصريف وتحليل الأفعال بكامله (2.5 مليون شكل تصريفي لـ 15400 فعل) إلى دقيقة واحدة على حاسوب منزلي متوسط المواصفات، ما يشير إلى قدرة نظام «يوني تكس» وفعاليته في إدارة الموارد اللغويّة».

وبيّن نعمة أن العمل جارٍ، على مسألة الأسماء ومتغيراتها (المثنى، والجموع والمؤنّث)، إضافة الى الحروف، مبيّناً إنجاز قرابة 95 في المئة من المفردات التي تحتويها اللغة العربيّة الحديثة (مع استثناء أسماء العلم)، إضافة إلى النجاح في تحليل نصوص إختباريّة بنسبة لامست الـ95 في المئة.

وتشمل آفاق تلك الجهود، إضافة إلى قطاع التعليم، التدقيق اللغوي لبرامج الكتابة، والتدقيق اللغوي الاحترافي في الصحف ودور النشر، والبحث على الإنترنت، والتدقيق في الترجمة الآليّة وغيرها.

وحاضراً، هناك موقع إلكتروني في صيغة أوليّة، لتصريف الأفعال العربيّة. ويعرض الموقع عيّنة من 300 فعل، مع وعد بأن يشمل بقية الأفعال الـ15400، عندما يطلق في صيغته النهائيّة. (العنوان الإلكتروني للموقع هو tasrif.univ-mlv.fr).

This article has been published at alhayat.com. Unauthorised replication is not allowed.


 
 
  1. Alternate textفشل النظم الراسمالي لبناء حوسبة فعالة لمتغيرات اللغة العربية

    يقوم نظام اليونيتكس في اصوله على حصر وفتح وتعداد ارتصاف عملية تركيب الكلمات الاصول والفروع في مختلف اللغات الأوروبية. ضمن عملية تصحيح وتغذية على مدار الثانية/اليوم اما في اللغة العربية فان الافتقار لمراكز تصحيح وتغذية اللغة على مدار التانية/اليوم يجعل مهمة جمع وقراءة وتحليل الأوضاع التي تنتاب كل فعل بمختلف حالاته (7 مليون حالة) واعداد برنامج للقيام بمهمة فيها هي مهمة تجارية أنفع للربح الراسمالي لكنها قليلة الفائدة في مجال تسهيل العمل العربي للحواسيب لان لا قوة كبرى تربح منه. الحل ميسور بتعاون الجامعات العربية الغنية مع جامعات ديالكتيك الحواسيب-اللغات، اي لغات النظم الحسابية المعقدة ونظم اللغويات المعقدة في الهند وروسيا والصين.

    الجمعة 24 نيسان 2015 4:55 م

  2. Alternate textنعمه نعمه

    شكرا على تعليقك، أود أن أشير بداية أن نظام يوني تكس هو مورد مفتوح مجاني يطوره مستخدموه بشكل يومي، ويشمل العديد من اللغات الأوروبية وتمّ تكييفه ليتلاءم مع اللغة العربية، وأضيف أن من قام بالتحديث العربي هم باحثون جامعيون متخصصون في معالجة اللغات الطبيعية ومن بينهم ألكسي عميد نعمه وهو مهندس متخصص في علوم الألسنية ومعالجة اللغات، وبالتالي فإن التحديث أتى من عربي المولد والمنشأ ومعرفته باللغة العربية أصيلة. أما النقطة الثانية التي أشرت إليها حول عملية التصحيح والتعذية على مدار الساعة فنحن نتمنى أن تتوفر وهي تنطبق جزئياً على نظامنا، فالتصحيح في البرنامج المقترح ليس عملية معقدة ولا حاجة لخبير برمجة للقيام بالتصحيح في حال الخطأ، وهذا يعود لإدارة الموارد اللغوية ومقاربتنا لها والتي في نظامنا وبرامجنا تختلف عن النظام المتبع في أوفيس حيث يدخل المستخدم الكلمة الى قاموس الحاسوب فتصبح في قاموس المدقق الإملائي العام لأوفيس عند تكرار إستخدامها، مما يتطلب مبرمجين على مدار الساعة للقيام بالمهمة. نظامنا وبرامجنا تقوم بتوليد الأفعال والأسماء حسب الأوزان والتصريفات المتعارف عليها في اللغة العربية ولها قاموس

    الجمعة 24 نيسان 2015 8:18 م

  3. Alternate textمصطفى حزين

    السلام عليكم حاولت تجربة عينة من الأفعال المضعفة أو الأفعال المعتلة الوسط بالواو، أو الأفعال المعتلة الناقصة والأفعال الرباعية لم أجد شيئا، هل العينة المعروضة قاصرة على الأفعال المطردة في تصريفها، ولا يقع فيها إعلال، وهل تراعى في هذه القواعد استخدامية الفعل، أم أنها عملية آلية تنتج أفعالا مرفوضة من الاستخدام الفعلي كعدم مجيء الفعل الأمر مثلا من الأفعال ذات الفاعل غير العاقل كأفعال الحيوان والجماد، عوى، أمطر، أثمر...

    الأربعاء 29 نيسان 2015 7:43 م

  4. Alternate textنعمه نعمه

    سيد مصطفى، ربما لم تبحث في لائحة الأفعال كلها، هذه بعض الأفعال التي تبحث عنها: رباعي: هوأن/ سيطر/ شيطن/ أكسد/ أزأز رباعي مزيد : تبحبح / تدحرج/ تدربأ/ تجعبى/ تطمأن/ تبلور مضاعف: أحّ/ أمّم/ مدّ/ حلّ/ عضّ/ ظلّ/ / لبّ/ أحبّ/ هدّد/ ضامّ/ إنقضّ معتل الوسط ومهموز: أوى/ أوّى/ آوى/ إئتوى /تأوّى/ إستأوى /كوى/ لوي/ /ألوى/ سوّى أما بخصوص الأمر من غير العاقل، فهو موجود كون التشبيه أو الإستعارة ممكن حصولهما لكن البرنامج لا يقبل أفعالاً غير موجودة

    الخميس 30 نيسان 2015 8:53 م

  5. Alternate textمهدي زواوي_مستشار في التربية

    السلام عليكم ورحمة الله أستاذ نعمة، شكراً على هذه الجهود الجميلة والمباركة. نظراً لأن كلمات اللغة العربية تحتمل العديد من المعاني (polysemous) فإن تصميم كذا برامج يأخذ وقتاً طويلاً وبرمجته تحتاج إلى: مختص في اللسانيات المعلوماتية (Computational Linguistics) و أيضاً إلى مختص في المورفوفونولوجيا، إلى جانب هذا مختصاً في علم النفس.

    الأحد 03 أيار 2015 3:57 م

  6. Alternate textنعمه نعمه

    شكرا سيد مهدي، الجهود قام بها باحثان هما ألكسي عميد نعمه وإيريك لابورت وهما فعلاً متخصصان في معالجة اللغات آلياً وهما خبيران في علوم الألسنية والعلوم الحاسوبية. والبرنامج المقترح لا يقدم نفسه كمورد للمعاني بل معجم تصريفي وتحليلي. وصحيح ما تقترحه لو كان عملهما يسعى الى قاموس المعاني ونضيف على الفريق إختصاصي تربوي، ولغة عربية.. قاموس المعاني هو عمل مختلف تماماً أما برنامج "تصريف فمحصور في تصريف الأفعال. نشكر مساهمتك ونتمى لك النجاح. ونرجو متابعتنا في جريدة الحياة حيث سنتطرق الى الجوانب تعليمية لهذه الموارد والتي نتمنى عليك مشاركتنا برأيك.

    الإثنين 04 أيار 2015 6:10 ص

  7. Alternate textنعمه نعمه

    شكراً سيد مهدي، الجهود قام بها باحثان هما ألكسي عميد نعمه وإيريك لابورت وهما فعلاً متخصصان في معالجة اللغات آلياً وهما خبيران في علوم الألسنية والعلوم الحاسوبية. والبرنامج المقترح لا يقدم نفسه كمورد للمعاني بل معجم تصريفي وتحليلي. وصحيح ما تقترحه لو كان عملهما يسعى الى قاموس المعاني ونضيف على الفريق إختصاصي تربوي، ولغة عربية.. قاموس المعاني هو عمل مختلف تماماً أما برنامج "تصريف فمحصور في تصريف الأفعال. نشكر مساهمتك ونتمنى لك النجاح. ونرجو متابعتنا في جريدة الحياة حيث سنتطرق الى الجوانب تعليمية لهذه الموارد والتي نتمنى عليك مشاركتنا برأيك.

    الإثنين 04 أيار 2015 12:59 م

 

نجوى كرم وتامر حسني أحدث المنضمين لمهرجان «موازين»  |  بتوقيت غرينتشعلماء يطورون نسيج قلب بشري من ورقة «سبانخ»  |  بتوقيت غرينتشافتتاح مهرجان «تطوان الدولي» بمشاركة 24 فيلماً  |  بتوقيت غرينتشتجنب تناول الفيتامينات واحصل عليها من الطعام  |  بتوقيت غرينتشملصقات عبوات الطعام تضلل المستهلكين  |  بتوقيت غرينتشالاتحاد الأوروبي يوصي بتعليق مئات الأدوية التي اختبرتها شركة هندية  |  بتوقيت غرينتشالتذمر المستمر من بؤس وظيفتك... يزيدها بؤساً  |  بتوقيت غرينتش«تويتر» يخطط لإصدار خدمات مدفوعة  |  بتوقيت غرينتشللمرة الأولى.. ولادة صوص يمتلك أربعة أرجل في البرازيل  |  بتوقيت غرينتشما هو "صداع الآيس كريم" وهل يجب أن تفزع عندما تصاب به؟  |  بتوقيت غرينتش