
* يقوم به شقيقان من الحلابية ببني سويف * مشروع ضخم لحوسبة اللغة العربية

* يقوم به شقيقان من الحلابية ببني سويف
* مشروع ضخم لحوسبة اللغة العربية
* الانتهاء من 500 مليون كلمة وجارٍ العملُ على مليار كلمة أخرى
* إنجاز أضخم معجم إلكتروني في تاريخ اللغة العربية ويمكن البحث فيه بأي اشتقاق
*"حوسبة اللغة العربية" ثورة عظيمة في مجال الذكاء الاصطناعي
* المهندس حسن: نحتاج إلى مؤسسات علمية وتمويلية داعمة لتسريع الانتهاء من المشروع
* فكرتنا تقوم على إفهام الآلة معاني المفردات وليس مجرد الاعتماد على تخزين المعلوما
* الدكتور حسين: فزنا بالعديد من الجوائز الإقليمية والدولية آخرها المركز الأول عالميا للإبداع في خدمة اللغة العربية
* مصادرنا كبرى المعاجم وأمهات الكتب التراثية في مختلف فروع اللغة العربية
كتب/ محمد سيف الدين
استطاع مهندس البرمجيات حسن علي النحاس وشقيقه الدكتور حسين علي النحاس مدرس بالأزهر الشريف من أبناء قرية الحلابية ببني سويف حوسبة أكثر من 500 مليون كلمة من أفعال اللغة العربية المفردة والمركبة، ضمن مشروع ضخم لتغذية الذكاء الاصطناعي، يتضمن أكثر من مليار ونصف مليار كلمة عربية.
المشروع الذي بدأه الشقيقان منذ 10 سنوات انتهى من حوسبة الأفعال والحروف والأسماء المبنية، وجارٍ العملُ على حوسبة الأسماء المشتقة والأسماء الجامدة، وهو ما قد يستغرق 5 سنوات أخرى. ويمكن الاطلاع على أول نتائج المشروع من خلال الموقع الإلكتروني: "المعجز في حوسبة العربية".
www.almo3jiz.com
ولتبسيط فكرة المشروع - فإن الذكاء الاصطناعي عمومًا يعتمد على تغذية السحابة الإلكترونية بالمعلومات من مختلف المصادر المتاحة، مثل: الكتب، والمقالات، ووسائل التواصل الاجتماعي مثل: فيسبوك وتويتر... ، وبالتالي فهو يتعامل مع شكل الكلمة وتكرار استعمالها في ذاكرته، وهذا يمكن أن يتوافق مع جميع لغات العالم، باستثناء اللغة العربية؛ لأن اللغة العربية لها طبيعة خاصة؛ لذلك فإن مشروع الشقيقين يعتمد على خصائص اللغة العربية، وقدرتها على الاشتقاقات لتوليد للكلمة؛ لذا فقد ابتكرا نوعًا جديدًا من الذكاء اللغوي التوليدي، والذكاء اللغوي الترابطي، يمكن من خلالهما بناء الكلمات وتحليلها، والربط بينها، وتحديد معناها الدقيق وبالتالي استخدامها في مكانها الصحيح بدقة متناهية.
المشروع في ظاهره أمر عادي، لكنه في الحقيقة أمر في غاية الأهمية، وثورة عظيمة في التعامل مع الذكاء الاصطناعي، وخدمة جليلة للغة العربية، ولكل ناطق بها، بل وللبشرية جمعاء، إذا تم الاعتماد عليه في الترجمات، واستخدامات الذكاء الاصطناعي.
كما يستطيع المشروع فور اكتماله تفسير وحوسبة أي كلام يقال أو يكتب؛ لذلك فقد حصل على جوائز كبرى إقليمية ودولية آخرها جائزة عبد العزيز سعود البابطين للإبداع في خدمة اللغة العربية الأسبوع الماضي بمشاركة البرلمان العربي، وتم التكريم تحت مظلة جامعة الدول العربية.
الشقيقان حسن وحسين عُرِض عليهما بيع هذا المشروع القادر على "توسيم" كل كلمات اللغة العربية وتجهيزها للتعامل الإلكتروني لمؤسسات خاصة ذات أهداف تجارية وربحية، لكنهما رفضا ذلك؛ لتحقيق النفع العام، وليستفيد منه كل الناس، رغم أنهما يقومان بهذا الجهد بعد ساعات عملهما الرسمية، وينفقان عليه من مالهما الخاص.
الشقيقان لا يريدان أكثر من التفرغ لهذا العمل الجبار، وكذلك رعاية مؤسسية له، كأن تتبنى المشروع أي مؤسسة كبرى تُعنى باللغة العربية، أو بالفضاء الإلكتروني؛ لأن المرحلة المقبلة من المشروع أكبر من إمكانياتهما المحدودة، فهذا المشروع عند اكتماله لن تقدر قيمته بالمال.
وعن فكرة المشروع أوضح الدكتور حسين علي النحاس أن قواعد اللغة العربية تتوافق تمامًا مع قواعد الحوسبة، وأنها اللغة الوحيدة التي يمكن حوسبتها بالكامل، مُنَوِّهًا إلى أنهما وضعا قواعد لتعليم الآلة كيف تحلل الكلمة وتختار المعنى الأدق للجملة المقترحة، وهي نفس فكرة الآلة الحاسبة في عمليات الجمع والطرح، والتي تقوم بالعمليات الحسابية عن طريق برمجتها ووضع قواعد تسير عليها دون الاعتماد على المعلومات المخزنة؛ لذلك فنتائجها دقيقة بنسبة 100%.
وأوضح أن المشروع يعتمد على أمهات الكتب اللغوية، والمعاجم التراثية والحديثة، والكتب المهتمة بأصول اللغة العربية، ومن خلال البحث عن أي كلمة في باب الأفعال، سواء أكانت مفردة، مثل: (كتب)، أو مركبة، مثل: (فأسقيناكموه) تظهر معاني الكلمة التفصيلية، وما بها من تغييرات صرفية أو إملائية، وما يتصل بها من سوابق. أو لواحق، وما يتعلق بها من قواعد، مع توثيق ذلك من المراجع العتيقة، مشيرًا إلى أن كثيرًا من الباحثين في اللغة العربية يعتمدون علي منتجاتنا اللغوية في توثيق أبحاثهم، وكُتبت حول المشروع مجموعة من الدراسات والأبحاث العلمية.
وعن الجمهور المستهدف من المشروع أوضح المهندس حسن علي النحاس أن المشروع تغيرت أهدافه ومدخلاته باختلاف مراحله، وبالتالي تغير جمهوره المستهدف، ليشمل جميع الناطقين بالعربية والمهتمين بدراستها، وأضاف أن الذكاء الاصطناعي يعتمد على ثلاثة أشياء لا رابع لها وهي: "السيرفرات، وخوارزميات العمل وأكواده، وأخيرا البيانات الضخمة نفسها أو اللغة المستخدمة". والدول المتحكمة في الذكاء الاصطناعي تعتمد على السيرفرات والأكواد لصعوبة الاعتماد على بيانات اللغة المستخدمة؛ لأن لغاتهم فقيرة، وليس بها اشتقاقات أو توليد كلمات كما هو موجود في اللغة العربية، ضاربًا المثل بكلمة: "لتعلمن" بأن البرنامج أخرج لها 133 تشكيلًا صحيحًا ومعنى جديدًا واستخدامًا مختلفا.
وبين المهندس حسن أن الذكاء الاصطناعي مبني على الاحتمالات والاختيار من المعلومات المخزنة، بينما نموذج الذكاء الاصطناعي الذي يقوم المعجز بإعداده نموذج منطقي، لا يحتاج إلى أكواد أو سيرفرات ضخمة، بل مبني على خصائص اللغة و"توسيمها"، وتوصيل الآلة لمرحلة عدم الاعتماد على الاحتمالات، بل التعامل المنطقي مع الكلمات وبالتالي فهذا النموذج سيكون الأدق في عالم الذكاء الاصطناعي، منبهًا إلى أن المشروع عقب اكتماله يمكنه الدخول على المخزون المعلوماتي في السحابة الإلكترونية، واختيار المعنى الأدق وعرضه أمام المستخدم.
وأضاف إننا قمنا بإنجاز معجم إلكتروني هو الأضخم في تاريخ اللغة العربية، ويمكن البحث فيه بأي اشتقاق، فما أن تدخل الكلمة (من باب الأفعال) يتم عرض كل اشتقاقاتها "بكبسة زر" ومعنى كل مفردة، وبالتالي فكل طلاب المراحل الإعدادية والثانوية والجامعية، وكل الباحثين وعلماء اللغة، بكل فروعها - هم الجمهور المستهدف، مؤكدًا أن هذا المشروع ثورة حقيقية في علوم البحث باللغة العربية؛ لأن الجميع يعتمد على اللغة كأداة جامدة، بينما نحن نتعامل مع اللغة العربية ككائن حي يمكن التوليد منها والربط بين مفرداتها ومعانيها.
ونبه إلى أن المشروع فور اكتماله يمكنه الدخول على أي معلومات مخزنة على السحابة الإلكترونية، سواء تعليقات أو كتب أو مقالات أو منشورات، وتحويلها إلى أكواد تمكن الآلة من فهم هذه المعلومات والإجابة عن أي سؤال يوجه إليها.
وتابع المهندس حسن النحاس بالقول: "هذا المشروع مشروع أمة سيبقى لمئات السنين بإذن الله تعالى؛ لذا فلابد من التعاون المؤسسي معنا لأن المرحلة المقبلة هي الأهم والأكبر والأخطر في حياة هذا المشروع الذي سيجعلنا نؤسس لمشروع ذكاء اصطناعي عربي أفضل من أي مشروع آخر.
ودعا الشقيقان جميع المؤسسات المهتمة باللغة العربية ومؤسسات التمويل للتعرف على المشروع ومعرفة قدراته وإمكاناته ونتائجه المتوقعة، والمشاركة في هذا الجهد الذي يُعد نواة للتفوق العربي في عالم التقنية الحديثة.