اها.. "اللهم أشكو إليك ضعف قوتي وعجزي وقلة حيلتي"; نعم؛ لكن كما نقول في المثل الشعبي (اعقلها وتوكل)، وهذا مثل دخل في لغات أخرى، وهو ايضا حديث شريف من ناحية المعنى اما من الناحية اللفظية والاسنادية فمشكوك في أمره. المهم، يجب ان نفعل شيئا ثم أشكو، اليس كذلك؟ خذ مشروع الأخ قيس ديوكس مثلا (corpus.quran.com) وهو مشروع مفتوح من البابين الفني والمعرفي. أضعف الايمان هو ان تقوم بارسال تعليق ما (سؤال أو إقتراح ..الخ..) ، مثلا (الترتيب حسب السهولة):
1- فكرة رائعة، بالتوفيق إن شاء الله.
2- السلام عليكم؛ قرأت تحليلكم النحوي للآية الفلانية فرأيت أنكم لم تذكروا وجهات نظر نحوية أخرى، فقد: قيل وقال، البصريون والكوفيون، قراءة فلان وقراءة علان..
3- شكرا؛ كيف يمكن لي المشاركة فقد قرأت الكثير في إعراب القرءان وفي تحليله لغويا؟
4- سؤال إن سمحتم، أعرف كيف أستخدم المتصفح (Firefox) كما أعرف كيفية تسخير برنامج (Adobe Audition CC)، وقد قمت بتحليل كامل للمقاطع الصوتية في قراءة فلان وعلان لسورة النور، واستخلصت بعض النتائج، فتساءلت ماذا يمكن إضافته لمشروعكم بهذا العمل؟
5- تعلمت مساء أمس قبيل الرقود كيفية التكلم (الكتابة) بلغة الترميز الممتدة (XML) وصباح هذا اليوم قمت بتعديل سورة النبأ في الملف (quran-uthmani.xml) التابع لمشروع (tanzil.info) حيث أضفت الوقف والابتداء وفق تلاوة فلان، ثم تساءلت ما الذي عسى أن يضيفه نشاطي هذا إلى مشروعكم المتميز؟
6- مرحبا، لقد اطلعت على "الشجيرة النحوية" (من بنك الشجرة التركيبة / Treebank) للاية 6 (
اهدنا الصراط المستقيم) ورأيت أنها قد تم تفكيكها وفق التحليل التصريفي النطقياتي الآتي:
ih'dinaa (V : PRON) Verb+Imperative+2P+Sg+Masc+ObjPron+1P+Pl
l-SiraaTa (N) Noun+Masc+Acc
l-mus'taqiima (ADJ) ActPart+Masc[form X]+Acc
(ترجمة الأشكال المختصرة لتلك المصطلحات اللسانية الحاسوبية إلى العربية)
اهدنا (فعل:ضمير) فعل + أمر + للمخاطَب + المفرد + المذكر + ضمير مفعولي + للمتكلم + الجمع
الصراط (اسم) اسم + مذكر + منصوب
المستقيم (نعت) اسم فاعل + مذكر + منصوب
ثم رجعت إلى بيانات الإصدار المعلومياتي في مشروع جامعة حيفا ورأيت أن التفكيك قد تم وفق التحليل التصريفي النطقياتي التالي:
hdi-naa hdy+Verb+Stem1+Imperative+2P+Sg+Masc+NonEnergicus+Pron+Dependent+1P+Pl
l-SiraaT-a Def+SrT+fi&aal+Noun+Triptotic+Masc+Sg+Acc
l-mustaqiim-a Def+qwm+Verb+Triptotic+Stem10+ActPart+Masc+Sg+Acc
(مرة أخرى ولابد، يتبع بترجمة الأشكال المختصرة لتلك المصطلحات اللسانية الحاسوبية إلى العربية)
هدنا جذر [ ه د ى ] + فعل + على وزن1: فَعَل + أمر + للمخاطَب + المفرد + المذكر + غير مؤكَّد + ضمير + متصل + للمتكلم + الجمع
الصراط التعريف + [ ص ر ط ] + فِعال + اسم + معرب + مذكر + مفرد + منصوب
المستقيم أل التعريف + [ ق و م] + فعل + معرب + على الوزن العاشر + اسم فاعل + مذكر + مفرد + منصوب
ولاحظت: فروقات بين الإصدارين، فنحن نستفيد من هذا التحليل ما لا نستفيده من الآخر (فكلمة (المستقيم) مثلا في م2ثال: اسم فاعل معرف من [ ق و م ] على وزن مضارعه (مع إبدال وتحريك)، على شكل:
-----
اهدنا -----
معالجة وسيلتكم الحاسوبية لها : سَلْب (الجذر+الوزن*+التوكيد+اتصال)
معالجة وسيلتكم الحاسوبية لها : جَلْب (تخصيص الضمير+معالجة الضمير المستتر وجوبا)
\ ملحوظة: *الوزن في هذه المعالجة غير مندمج في الإشتغال التفكيكي \
والعكس صحيح:
معالجة وسيلة مشروع جامعة حيفا الحاسوبية لها: سَلْب (تخصيص الضمير+معالجة الضمير المستتر وجوبا)
معالجة وسيلة مشروع جامعة حيفا الحاسوبية لها: جَلْب (الأصل+الوزن+التوكيد+الاتصال)
\ ملحوظة: الوزن في هذه المعالجة مندمج في الإشتغال التفكيكي \
ولاحظت: من ناحية الترقيم إمكانية الجمع بين الإختيارين (hdi-naa و ih'dinaa) فالهمزة وصلية تثبت ابتداء وتحذف درجا، وهكذا..
وسؤالي لكم: لقد أنهيت نشاط المقارنة بين التحليلين لسورة الفاتحة، وتوصلت إلى نتائج مفادها هيت وكيت، سأرفقها لكم في بريدي، وأنا في خدمتكم للقيام بأي نشاط آخر في سبيل تطوير مشروعكم المحترم، والسلام.
7- .. الخ...
خلاصة الكلام: ضعف القوة، وتوهم العجز، وقلة الحيلة مجرد أوهام وخداع نفس لأن أضعف الإيمان (1) ثم بين (1) و (2) إقتراحات كثيرة بالمئات، وإنما اختزلت الطريق ببعض الأمثلة فقط.
أما "إني والله ما آمن يهود على كتابي" فلا محل لها من الإعراب هنا، فكما نعلم أن الكيان الصهيوني يحاول بكل قوة وبشتى الوسائل تحسين صورته أمام العالم، ومن تلك الوسائل وسيلة البحوث والأبحاث العلمية الجادة المبدعة في العلوم الطبيعية والتقنية والانسانية والإجتماعية. ثم إن الأبحاث على هذا المستوى غالبا ما تؤدي إلى إعادة نظر في مسلمات تخصصية، فينتج عنه تطوير للتخصص من خلال عرض الفكرة على المسائل المشكلة، وهذا وارد بشكل قوي في تخصصات ذات أبعاد واسعة ومتداخلة كما هو الحال مع الحوسبة اللسانية .
وأخيرا، فكرة كهذه أو شبيهة لها فكرة مهمة جدا وتمثل الجواب العملي على تلك الأسئلة المتكررة من قبيل "أبحث عن موضوع بحث لنيل درجة البكالوريوس في قسم اللغة العربية"، فتقول له: نعم، وغيرك من أقسام أخرى: قسم اللسانيات، وقسم اللسانيات التطبيقية، وقسم الحاسوبيات والمعلوميات، وقسم الرياضيات والحوسبة، وقسم القراءات.. يبحثون عن نفس الشيء- بحث لنيل درجة البكالوريوس؛ فهاكم! تفضلوا وتعاونوا على مشروع واحد مندمج ومفتوح للإبداع ..
(معلومة فنية هامشية:
الثنائيات مندمج/غير مندمج و سلب/جلب تعني أن المعالجة الحاسوبية في مشروع حيفا قائم على خَوَرْزَمَة (ابتداع خطوات خوارزمية) فنمذجة قواعد الآلة ذات الحالات المنتهية لكي تقوم الآلة بمسح المصدر وانتاج المشباك التصريفي النطقياتي بشكل آلي دون تدخل مباشر من الذات المفكرة (المستخدم) ودون الإعتماد على الذاكرة المخزنة (قاعدة البيانات). والآلة هذه هي لب مشروع حيفا الذي يستخدم تقنية زيروكس المفتوح، وهي آلة يمكن الانتصار لها في الرياضيات والمنطق والتقنية للحصول على النتائج الصلبة من جهة الفعالية والكفاءة، أما في اللسانيات فهناك عراقيل تجعل التركيب اللغوي أحيانا غير قابل للخورزمة وبالتالي لا يصلح للحوسبة مثل المتشابه والمشترك والتقريب النحوي ..الخ..
في مشروع حيفا تم ترقيم الكلمات بشفرة المعلومات المعيارية المتداولة بدل حروف الهجاء العربية وذلك من أجل تضييق مجال المتشابه فكلمة صراط هكذا قد تكون منصوبة / مجرورة / مرفوعة، فيصعب نمذجة الحالة الإعرابية، رغم فعاليتها في حالة ضبط الملحقات مثل ياء الملكية (صراطي بالعربية لكن SiraaT-i الاسم المجرور ليس هو SiraaT-i الاسم مع الضمير في محل جر مضاف إليه) حيث ستقوم بمقارنة درجة التعقيد أثناء هندسة هذه البيانات (نقل المعلومات من مجال علوم اللغة عبر مجال اللسانيات إلى مجال الحوسبة ثم مجال الحاسوبيات) من خلال العلامات التي بها ضبط اقسام الكلام (part of speech) اسم او فعل او حرف، وبه علامات الاعلال والتبديل تتم حوسبة الجذر (root) والاصل الاشتقاقي (lexeme)، وتحديد الوزن (pattern)، وقسم الكلمة في البناء والإعراب (case marking)، وجنس الكلمة (gender)، .. وهي بدورها مستويات فاقسام الكلام (فعل، حرف، اسم) ثم (فعل، فعل-حرف، حرف، حرف-اسم، اسم)، وهلم جرا. أقول علامات للقواعد التي ستشتغل بها الآلة ذات الحالات المنتهية، فالمصطلح معروف في النحو (علم الجملة أو التركيب والإعراب والصرف النحوي)، مثلا يقال "فاعلم وتا التانيث ميزه ورد" أي إذا دخلت تاء التأنيث على كلمة فهي فعل، وهي أيضا علامة لاأحادية القطب لتخصيصها الفعل أنه في الماضي وليس في الحاضر ولا الأمر ولا التوكيد. هذه العلامات تفيد الذي لا يستطيع التمييز بين اقسام الكلام بناء على الدلالة المفهومية وحدها، أما الحاسوب فآلة صماء عمياء لا تصلح لها الدلالة اللفظية ولا الدلالة المفهومية، وهنا سيأتي سؤال تحديد الحالات التي يجب أن تنتهي عند حد معلوم وإلا لا وجود لآلة الحالة المنتهية (FSA) وبدونها لا وجود للحوسبة اللسانية وبدون الحوسبة اللسانية لا وجود للسانيات الحاسوبية وبالتالي لا تطبيق من تطبيقات السانيات الحاسوبية مثل "التحليل التصريفي النطقياتي" الذي يدور حوله الموضوع. وهذا سؤال أساسي، والحل أن يتم تحديد كل العلامات (ما هي علامات الاسم في العربية؟ أل التعريف، الإسناد، الجر، التنوين، ..) فهذه علامات الاسم، التي يجب أن تشكل مجموعة مغلقة ومحكمة (متتالة: مجموعة س --> [ع
1، ع
2، .. ع
ن] |
ن عدد صحيح طبيعي).. ونفس الشيء مع أنواع وأقسام الاسم..
طبعا، يمكن للتطبيق القيام آليا بمعالجات في حالات مفتوحة، ولكن هنا لا يضيف من عنده شيئا،. مثلا، إذا وجد كلمة في تركيب ما وهذه الكلمة لا تتكون من وحدات مكتفية، فسوف يعالج الذي قبلها أو الذي بعدها. وفي حالة أخرى (إفتراضية) سيضيف عامل معروف موجود في الذاكرة مثل ان الحرف لا يدخل على الحرف فاذا حدث ذلك فالكلمة الثانية اسم في الجملة وهي اسم وحرف في ذاتها، أو يضيف التاء مثلا ويرسل طلبا إلى قاعدة البيانات التي هي دليل تصريف الأفعال (هات كلمة+ت) في المثال المفترض.. وهذه طريقة بهلوانية، وما أكثر البرامج التي رُكّبت بهذا الشكل (توسيع دائرة الطلبات بين البرامج الحاسوبية والملفات المساعدة)، إضافة لعدم صلاحيتها للتعميم. إذن، البرنامج الحاسوبي الذي يستحق أن يسمى كذلك شبيه بطريقة القدامى في تقعيد العلوم: هاك الأصول مع بعض الحالات الشاذة هنا وهناك، والباقي تعميم وتجريد وتمثيل وانزال .. الخ. أي التقليل من المحفوظات قدر ما يمكن. عليه لابد من محددات فعالة وكلما كانت أدق كلما كان التحليل أفضل، ونفس الشيء في مجالات لسانحاسوبية أخرى مثل الترجمة الآلية وهي أكثر تعقيدا لأن التحليل لا ينحصر في نفس المجال بل يعمل بين مجالين إذ تقوم الآلة بتحليل ثنائي وتفاعلي الإتجاه: هكذا مثلا، المستتر والمقدر والمحذوف وو.. في لغة المصدر (SL) ليس كذلك بالضرورة في لغة الهدف (TL). هذه إشكالية أخرى أكبر وأعظم من مشكلة "تحديد نطاق الكلام"، ألا وهي مشكلة السياق والسياق في علاقة تفاعلية أخذ ورد مع التحليل اللغوي.
والمهم، الغاية القصوى هو تحقيق أدق النتائج وهذا يعني أن مثل هذه المشاريع تنتنظر وتتوقع باستمرار الجديد الذي سيأتي من تخصصات علمية أخرى كثيرة. وتحقق ذلك درجات، فأدنى درجة هو الإقتراب من التحليلات اللغوية (في كتب علوم اللغة) وعلى أساس نسبة الفرق يتم إعادة النظر في معايير ومحددات المسح الآلي، مع ترقب الجديد، وسرعة التحليل، وتغطية النقاط السلبية في التطبيقات الأخرى، ومغامرة المواجهة مع الأسئلة المحرجة في مجال الحوسبة اللسانية، والتعميم (معالجة نصوص أخرى في نفس اللغة) مثلا بالإنجليزية سأحلل نص ترجمة (الفاتحة 6) بنفس التقنية المستعملة في مشروع حيفا:
اهدنا الصراط المستقيم
Guide us to the straight path
ملحوظة: التحليل التصريفي النطقياتي يتجاهل التحليل الصوتياتي وبالتالي الإختلاف بين القراءة الأمريكية (gaɪd əs tə ðə streɪt pæθ) والقراءة البريطانية (gaɪd ʌs tuː ðə streɪt pɑːθ)، وطبعا نتكلم هنا عن الحرفين المعياريين وإلا فالحروف الإنجليزية متعددة بتعدد لهجاتها. وكذلك نفترض أنها لا تؤثر في تقسيم الجملة إلى الكلمات (المرفيمات) التي تتكون منها.
<guide>+Verb+Pres+Non3sg
<we>+Pron+Pers+Obl+1P+Pl
<to>+Prep
<the>Def+SP
<straight>+Noun+Sg+Adj
<path>+Noun+Sg
المقارنة الشكلية لا معنى لها إذ لا نكتب بالمقابل (Guide-us the-path the-straight)، عكس التحليل التصريفي الذي يتيح فرصة رائعة للمقارنة بين الأصل والترجمة من الناحية التركيبية. إضافة لفوائد كثيرة لا تحصى، في مثل تلك المشاريع، وفي اللسانيات الحاسوبية و الحوسبة اللسانية بشكل عام. تخيل معالجة حسابية بسرعة البرق يتم خلالها تحليل كل كلمة كُتبت في ملتقى أهل التفسير (من أول يومه حتى هذا التعليق)، وفي لحظات قليلة يخبرك بدقة عالية ما هي النسبة المئوية من الألفاظ المسجلة في قاموس المحيط للفيروزآبادي ولم تستعمل في الملتقى، والعكس، وو.. هذا كله لا سبيل إليه بدون تحليل تصريفي على المستوى المطلوب من الدقة والكفاءة.
كانت تلك الفكرة العامة الموجزة لتسهيل تصور المشروع بصورة فنية، والمشروع حاول تجاوز الآفات في المشاريع التي سبقته، والتي اعتمد عليها، فتطويرها. المشروع يفيد في التدريس والبحث العلمي (واظن انه يعود بنفع - آخر لم يصرح به - على الدراسات اللغوية واللسانية والألسنية العبرية، لأن العبرية كانت شبه ميتة إن لم نقل أنها كانت منقرضة)؛ ومن ناحية التفكيك والتحليل أراد المشروع تقديم هذه الوسيلة للباحثين الذي يريدون تحليلات أدق وأشمل وأحسن من مردودية التطبيقات الحاسوبية التقليدية (دليل الألفاظ index، القاموس dictionary، المعجم المفهرس للألفاظ concordance)؛ هذا، وقد اعتمد المشروع في ترقيم الآيات القرءانية بشكل رئيسي على المعجم المفهرس لألفاظ القرآن الكريم لمحمد فؤاد عبد الباقي).