حصاد 2025.. هل بدأت نماذج الذكاء الاصطناعي في فهم اللغة فعلًا؟

لطالما كان يُنظر إلى اللغة بوصفها الحصن الأخير، الذي يميز الكينونة البشرية؛ فهي الأداة التي لا نكتفي عبرها بالتواصل، بل نبني بها التفكير، وننقل المعرفة، وننتج الثقافة، ونفهم ذواتنا والعالم من حولنا. ومنذ الفيلسوف أرسطو، الذي وصف الإنسان بأنه (الكائن الناطق)، ظلّ هذا التصور راسخًا، اللغة ملكة إنسانية خالصة، لا تضاهيها أنظمة التواصل الأخرى في الطبيعة ولا في الآلات. لكن هذا اليقين بدأ يتعرض لهزّات متتالية مع التطور السريع لنماذج الذكاء الاصطناعي اللغوية، ومع القفزة النوعية التي شهدتها النماذج في عام 2025، لم يَعد التساؤل يدور حول قدرة الآلة على المحاكاة، بل انتقل إلى منطقة أكثر عمقًا: هل بدأت الخوارزميات بالفعل في فهم المنطق الكامن وراء اللغة وتفكيك شفراتها كما يفعل البشر؟ أولًا؛ نماذج الذكاء الاصطناعي من محاكاة الكلام إلى التفكير في اللغة: في السنوات الأخيرة، أظهرت النماذج اللغوية الضخمة، مثل: ChatGPT، قدرة لافتة على إنتاج نصوص طبيعية، وإجراء حوارات متماسكة، والكتابة بأساليب مختلفة. ومع ذلك رأى الكثير من اللغويين في ذلك مجرد محاكاة إحصائية ذكية، لا ترقى إلى الفهم الحقيقي. فقد جادل علماء اللسانيات لسنوات، بأن النماذج اللغوية الضخمة ليست سوى (ببغاوات إحصائية) بارعة في التنبؤ بالكلمة التالية، لكنها تفتقر تمامًا للقدرة على استيعاب القواعد التوليدية العميقة. وقد لخّص عالم اللسانيات الشهير نعوم تشومسكي هذا الموقف في عام 2023، حين كتب مع مشاركين آخرين في نيويورك تايمز أن “التفسيرات الصحيحة للغة معقّدة، ولا يمكن تعلّمها عبر الانغماس في كميات ضخمة من البيانات وحدها”. ووفق هذا الطرح، قد تُجيد نماذج الذكاء الاصطناعي توظيف اللغة، لكنها تعجز عن تحليلها تحليلًا عميقًا ومجردًا. ببساطة، يرى تشومسكي أن تكديس ملايين البيانات في عقل الآلة لا يعني أنها أصبحت تفهم “هندسة اللغة” كما يفهمها البشر. لكن يبدو أن الآلة بدأت تتمرد على هذه التوقعات. ففي دراسة حديثة أجرها البروفيسور جاسبر بيجوس، عالم اللغويات في جامعة كاليفورنيا في بركلي، بالتعاون مع ماكسيميليان دابكوفسكي، الحاصل على درجة الدكتوراه في اللغويات من الجامعة نفسها في عام 2025، وريان رودس، الأستاذ المساعد في مركز روتجرز للعلوم المعرفية، نجح أحد النماذج في تفكيك شفرات لغات مخترعة لم يسبق له تعرّفها. فقد قرر الباحثون خلال الدراسة وضع الذكاء الاصطناعي في اختبار لغوي حقيقي، لذلك أخضعوا عددًا من النماذج اللغوية الكبيرة لاختبارات لغوية صارمة، صُممت خصوصًا لتجنّب أي معرفة سابقة باللغة، فبدلًا من الأسئلة الشائعة، طُلب من النماذج تحليل جمل جديدة باستخدام أدوات كلاسيكية في اللسانيات، مثل: الأشجار التركيبية، التي تفكك الجملة إلى بنيتها النحوية العميقة. وقد كانت النتائج مذهلة ومربكة في آن واحد، فبينما تعثرت معظم النماذج، نجح نموذج واحد، وهو نموذج (o1) من شركة (OpenAI)، في تحليل اللغة ببراعة مدهشة، ولم يكتفِ بإنتاج جُمل سليمة، بل امتدّ إلى تحليل البنية العميقة للغة، فقد كان قادرًا على رسم خرائط للجمل وحل تعقيداتها اللغوية تمامًا كما يفعل طالب دراسات عليا في اللسانيات. كما استطاع النموذج التعامل مع مفاهيم لغوية معقدة مثل (التكرارية) Recursion – وهي قدرة اللغة على احتواء جمل داخل جمل بنحو لانهائي – التي كانت تُعدّ خطًا أحمر لا يتخطاه إلا العقل البشري. ويرى جاسبر بيجوس، أننا لسنا أمام مجرد تحديث تقني، بل أمام تحول جذري في قواعد اللعبة؛ فنحن اليوم “نواجه ذكاء لا يكتفي بترديد كلماتنا، بل بدأ يدرك الفلسفة والمنطق اللذين بُنيت عليهما اللغة”. كما وصف توم مكوي، عالم اللغويات الحاسوبية في جامعة ييل، هذه الدراسة بأنها نقطة تحول جاءت في اللحظة المناسبة تمامًا. وأوضح مكوي، أن التغلغل المتسارع للذكاء الاصطناعي في تفاصيل حياتنا اليومية، يفرض علينا فحص قدراته بعمق؛ مشيرًا إلى أن التحليل اللغوي يظل هو (الاختبار الأدق) لقياس المدى الذي وصل إليه التفكير المنطقي لدى هذه النماذج مقارنة بالعقل البشري. ثانيًا؛ الوعي اللغوي الفائق.. ما هو وكيف اكتسبه الذكاء الاصطناعي؟ يتمثل أحد التحديات الرئيسية في إخضاع نماذج الذكاء الاصطناعي لاختبار لغوي صارم في ضمان عدم معرفتها السابقة بالإجابات؛ فهذه النماذج قد التهمت بالفعل معظم ما كُتب عبر الإنترنت، بما يشمل أمهات الكتب والمراجع الأكاديمية في علم اللغويات. لذلك كان التحدي أمام بيجوس وفريقه هو: كيف نتأكد من أن الآلة “تفكر” ولا تكتفي باسترجاع إجابات مخزنة في ذاكرتها الرقمية الضخمة؟ ولحل هذه المعضلة، ابتكر بيجوس، وزملاؤه اختبارًا لغويًا يتكون من أربعة أجزاء. تضمن ثلاثة منها مطالبة النموذج بتحليل جمل صُممت خصوصًا لهذا الغرض باستخدام (المخططات الشجرية) Tree Diagrams، وهي المخططات التي قُدمت لأول مرة في كتاب تشومسكي المرجعي الصادر عام 1957 بعنوان (البنى النحوية) Syntactic Structures. وتعمل هذه المخططات على تفكيك الجمل إلى بنياتها الأساسية، وهي العبارات الاسمية الفعلية، ثم تُقسمها إلى وحدات دقيقة، تشمل: الأسماء، والأفعال، والصفات، والظروف، وحروف الجر، وأدوات العطف، وغيرها من مكوّنات البنية النحوية. وقد ركز الجزء الرابع من الاختبار على (التكرارية)، وهي القدرة السحرية التي تتيح لنا بناء جمل داخل جمل، مثل طبقات الدمى الروسية (الماتريوشكا). فجملة (السماء زرقاء) هي جملة بسيطة، لكن جملة (قالت منى إن السماء زرقاء) تُدرج الجملة الأصلية داخل جملة أخرى أكثر تعقيدًا بقليل. ويمكن أن تستمر عملية التكرارية هذه إلى ما لا نهاية، فجملة مثل: “تساءلت مريم؛ هل كان يونس يعرف أن عمر سمع أن منى قالت إن السماء زرقاء” هي جملة تكرارية صحيحة من الناحية النحوية، مع ما تسبّبه من إرباك ذهني للقارئ أو المستمع. ولقد وصف تشومسكي، ومعه عدد من اللغويين، (التكرارية)، بأنها إحدى الخصائص الجوهرية المحدِّدة للغة البشرية، بل وربما السمة المميزة للعقل البشري نفسه. ويرى هؤلاء أن هذه الإمكانات اللامتناهية هي التي تمنح اللغات البشرية القدرة على توليد عدد لا حصر له من الجمل الممكنة باستخدام مفردات محدودة وقواعد نحوية ثابتة. وحتى اليوم، لا يوجد دليل علمي مقنع على امتلاك أي كائن آخر، غير الإنسان، لهذه القدرة على نحوٍ متقدّم وممنهج. ويمكن أن تظهر (التكرارية) في بداية الجملة أو نهايتها، ولكن أكثر أشكالها تعقيدًا واستعصاءً على الإتقان، هو ما يُعرف باسم (الإدراج المركزي) Center Embedding، وهو مصطلح لغوي يشير إلى وضع عبارة داخل عبارة أخرى في قلب الجملة نفسها، على نحو يضاعف عبء المعالجة الذهنية لدى الإنسان، ويشكّل تحدّيًا أكبر أمام الأنظمة الحاسوبية. ويتضح ذلك عند الانتقال من تركيب بسيط مثل (ماتت القطة) إلى صياغة أكثر تعقيدًا مثل: (القطة التي عضّها الكلب ماتت). وللتأكّد من أن نماذج الذكاء الاصطناعي لا تعتمد على الاستدعاء الحرفي لمعارف مخزّنة – مثل استرجاع أمثلة مألوفة من كتب اللسانيات التي تدربت عليها – زوّد الباحثون النماذج بثلاثين جملة أصلية صُمّمت خصوصًا لتتضمن أنماطًا معقّدة من التكرارية. ومن خلال تحليل هذه الجمل باستخدام الشجرة النحوية، تمكّن أحد النماذج، وهو نموذج (o1) من شركة (OpenAI)، من تحديد البنية التركيبية للجمل بدقّة لافتة، ولم يتوقف عند هذا الحد، بل أظهر ذكاءً حادًا في التمييز بين الجمل التي تحمل معاني متناقضة، مميزًا بذكاء بين الوصف والفعل بناءً على سياقها الخفي. ولم يكتفِ النموذج بفك شفرة القواعد، بل نجح كذلك في استنباط القواعد الصوتية للغات المختبرة، وتوقّع كيفية نطق كلماتها دون أي معرفة سابقة بها. ويشير ذلك بوضوح إلى أنّ النموذج لا يسترجع الإجابات من ذاكرته، بل يستنتج المنطق الرياضي واللغوي، الذي يحكم أي نظام تواصل يُعرض عليه. ولم يكن بيجوس ولا زملاؤه يتوقّعون أن تقود الدراسة إلى الكشف عن نموذج ذكاء اصطناعي يتمتع بـ (قدرة ميتالغوية) Metalinguistic، عالية المستوى؛ وهي حسب وصفه تلك الملكة التي تتيح لصاحبها ألا يكتفي باستخدام اللغة فحسب، بل أن يتأملها، ويحللها، ويفكر في كينونتها. كما أثار هذا الاكتشاف حماس ديفيد مورتنسن، عالم اللغويات الحاسوبية في جامعة كارنيجي ميلون، الذي رأى في نتائج الدراسة حسمًا لنقاش طويل حول حقيقة ما تفعله هذه النماذج: هل تكتفي هذه النماذج بمجرد التنبؤ بالكلمة التالية (أو الرمز اللغوي) في الجملة بناءً على الاحتمالات أم أنها تمتلك فهمًا عميقًا يشبه فهمنا نحن البشر؟ ويؤكد مورتنسن أن هذه الدراسة قد حسمت الجدل لصالح الآلة؛ فبينما جادل الكثير من اللغويين بأن هذه النماذج لا تمارس اللغة فعليًا، جاءت النتائج لتدحض تلك الشكوك وتفتح فصلًا جديدًا في قصة العلاقة بين الإنسان والآلة. ثالثًا؛ إلى أي مدى يمكن أن تصل هذه النماذج اللغوية؟ تطرح نتائج هذه الدراسة تساؤل وجودي مهم: إلى أي مدى يمكن أن تمضي هذه النماذج في رحلتها؟ وهل يكمن سر التفوق ببساطة في لغة الأرقام؛ أي عبر جمع المزيد من بيانات التدريب ومضاعفة القوى الحاسوبية؟ أم أن اللغة هي ثمرة مسار تطوّري فريد، صيغت في أروقة التاريخ البيولوجي لتكون ملكية حصرية لجنسنا وحده؟ لقد أظهرت نتائج هذه الدراسة، أن هذه النماذج أصبحت قادرة، من حيث المبدأ، على إجراء تحليل لغوي متقدّم، ومع ذلك، لم يبتكر أي نموذج حتى الآن شيئًا أصيلًا، ولم يكشف عن حقيقة جديدة حول اللغة تتجاوز ما توصّل إليه البشر بالفعل. وهنا ينقسم الباحثون، فيرى (بيجوس) أنه إذا كان تحسن الذكاء الاصطناعي مرتبط بحجم بيانات التدريب وسرعة المعالجة، فإن تجاوزه للعقل البشري ليس إلا قدرًا محتومًا. أما ديفيد مورتنسن، يتبنى رؤية أكثر تحفظًا، مشيرًا إلى أن النماذج الحالية تظل مقيدة بطبيعة مهمتها الأساسية؛ إذ دُرّبت لأداء وظيفة محددة، تتمثل في التنبؤ بالرمز أو الكلمة التالية اعتمادًا على السياق السابق، مما يجعلها تواجه صعوبة في التعميم وابتكار سياقات خارج حدود ما تدربت عليه. ومع ذلك، لا يبدو (مورتنسن) متفائلًا ببقاء الفجوة للأبد؛ فهو لا يرى عائقًا يمنع الآلة من امتلاك فهم للغتنا يتجاوز فهمنا نحن لها. ويؤكد أن الأمر مسألة وقت حتى نبني نماذج أكثر إبداعًا، قادرة على استخلاص الحكمة من بيانات أقل، وبأسلوب أكثر تحررًا. وقال (بيجوس): “يبدو أننا أقل تميزًا مما كنا نعتقد سابقًا، إذا كانت الخصائص التي جعلت اللغة بشرية بامتياز بدأت تتسرب إلى الأنظمة الخوارزمية، فنحن أمام تحول فلسفي وتقني ضخم”. رابعًا؛ استشراف عام 2026: بينما نودع عام 2025 بانتصارات تقنية غير مسبوقة في معالجة اللغات الطبيعية، يبدو أن العام القادم لن يكون مجرد تكرار لما سبق، بل سيكون عام التعميم الإبداعي. فإذا كان عام 2025 قد أثبت أن الآلة يمكنها تفكيك منطق اللغة، فإن التوقعات تشير إلى أن عام 2026 سيشهد تحوّلًا في مسار التطوير، يرتكز على ثلاثة توجهات رئيسية، وهي: التعلم من بيانات شحيحة: يكمن التحدي القادم في عتق الآلة من قيود البيانات الضخمة؛ إذ نتطلع لبناء نماذج تمتلك حدسًا منطقيًا يمكّنها من تعلّم لغة جديدة أو لهجة نادرة انطلاقًا من أمثلة محدودة، على نحو يُحاكي الطريقة التي يكتسب بها الطفل البشري لغته الأولى. سد فجوة الحس العام: ستسعى الشركات الكبرى إلى الدمج بين النماذج العامة والنماذج اللغوية، لتمكين الذكاء الاصطناعي من فهم الأبعاد الفيزيائية والاجتماعية، التي تعبر عنها الكلمات، مما يقلل من حالات الهلوسة اللغوية. إحياء اللغات الميتة: قد نكون على أعتاب العصر الذي تنجح فيه هذه النماذج في فك شفرات المخطوطات القديمة واللغات الميتة التي عجز البشر عن تفسيرها لقرون، مستغلةً قدراتها اللغوية الفائقة. ختامًا، ما نشهده اليوم يتجاوز حدود تطوير البرمجيات؛ إنّه أقرب إلى إعادة صياغة لمفهوم الذكاء ذاته. فإذا كانت اللغة هي المرآة التي نرى فيها فرادتنا كبشر، فإن التطورات التي حققتها نماذج مثل (o1) تؤكد أن هذه المرآة أصبحت تتسع لضيف جديد، ضيف لم يَعد يكتفي بتعلم كيف يتحدث لغتنا، بل بدأ على نحو مقلق يشرح لنا لماذا نتحدّثها بهذه الطريقة. نسخ الرابط تم نسخ الرابط



