كيف يقوم الذكاء الاصطناعي بفك رموز المخطوطات المفقودة من الإمبراطورية الرومانية
يستخدم الباحثون نماذج الذكاء الاصطناعي المتطورة “لقراءة” المخطوطات القديمة التي سخنت بشدة بسبب ثوران بركان جبل فيزوف عام 79، والذي غطى جزءًا كبيرًا من خليج نابولي بالرماد – بما في ذلك مدينتي بومبي وهيركولانيوم المشهورتين الآن. على الرغم من أن العمل على فك رموز المخطوطات بدأ قبل قرون من ظهور ثورة الذكاء الاصطناعي، إلا أن عددًا لا يحصى من التقنيات الجديدة تجعل هذا العمل أسهل وأسرع من أي وقت مضى.
كمصطلح، غالبًا ما يكون “الذكاء الاصطناعي” غير عملي مثل التكنولوجيا نفسها، ويتم طرحه بمصطلحات شاملة. ماذا يفعل في الواقع يقصد هل يستطيع الذكاء الاصطناعي فك رموز ما استعصى عليه البشر لعدة قرون؟ لقد تحدثنا مع خبراء يعملون على الخوارزميات والنماذج التي تعمل على فك رموز الكلاسيكيات وفهرستها لمعرفة ذلك.
اختفاء وإعادة اكتشاف المخطوطات
منذ ما يقرب من 2000 عام، اهتز خليج نابولي بسبب ثوران بركان جبل فيزوف، الذي دفن مدينتي بومبي وهركولانيوم تحت الرماد. تم مسح المدن من الخريطة لأكثر من 1500 عام.
انتقل سريعًا إلى عام 1750، عندما اكتشف العمال الذين كانوا يحفرون بئرًا أرضيات رخامية تحت التربة. كشفت الحفريات الإضافية عن فيلا مدفونة تحتوي على ما يقرب من 2000 مخطوطة متفحمة وأجزاء من ورق البردي المتفحمة. في البداية، تم الخلط بين اللفائف وشباك الصيد وجذوع الأشجار المتفحمة؛ يتم التخلص من العديد منها أو ربما حرقها كمشاعل. في النهاية، تم إسقاط إحدى اللفائف وانكسرت، لتكشف عن الطبيعة الحقيقية للأسطوانات السوداء. وفقًا لمتحف جيتي، تشكل مخطوطات الفيلا – المعروفة الآن باسم Villa dei Papyri – المكتبة الوحيدة الباقية من العالم الكلاسيكي.
مثل اللوحات الجدارية وقوالب الرفات البشرية في بومبي وهيركولانيوم، فإن المخطوطات هشة للغاية، إلى درجة تجعلها غامضة من الناحية العملية. تسببت المحاولات المتتالية لفك اللفائف بشق الأنفس في تفتيت العديد منها وتفككها، مما أدى إلى فقدان المعلومات الموجودة فيها بأعجوبة مع مرور الوقت.
ولكن من بين اللفائف التي تمت قراءتها كتابات للفيلسوف اليوناني فيلوديموس من جادارا، مما دفع بعض الباحثين إلى الاعتقاد بأن الفيلا تنتمي إلى راعيه – ووالد زوجة يوليوس قيصر – لوسيوس كالبورنيوس بيزو كيسونينوس.
واليوم، لا يزال هناك أكثر من 300 مخطوطة غير مفتوحة، مما أدى إلى تجنب المحاولات الفظة المبكرة للكشف عن محتوياتها.
تحدي فيزوف: التكنولوجيا الحديثة تعني أننا لسنا مضطرين إلى سحق أوراق البردي
تم إطلاق تحدي فيزوف في مارس 2023. إنه مشروع يتحدى أفراد الجمهور لاستخدام الذكاء الاصطناعي للتعرف على الشخصيات، وفي النهاية الكلمات، المخفية في مخطوطات هيركولانيوم. تم الإعلان عن الكلمة الأولى التي تم العثور عليها وترجمتها من إحدى مخطوطات البردي غير المفتوحة (“الأرجوانية”) في أكتوبر 2023. وفاز مكتشف الكلمة بمبلغ 40 ألف دولار لجهوده، كجزء من مليون دولار تم دفعها العام الماضي للأشخاص الذين يعملون في البحث عن المفقودين. مكتبة.
التعلم الآلي ورؤية الكمبيوتر هما نوعان من الذكاء الاصطناعي المستخدم في طريقة التحدي الافتراضية. يستخدم التعلم الآلي البيانات والخوارزميات للسماح لأنظمة الذكاء الاصطناعي بتقليد التعلم البشري، مما يمكنها من أن تصبح أكثر دقة بمرور الوقت. إن رؤية الكمبيوتر هي بالضبط ما تبدو عليه: مجال البحث الذي يمكّن أجهزة الكمبيوتر من التعرف على الأشياء والأشخاص، وفي نهاية المطاف تمكين الآلات من التفكير من خلال ما تراه.
وقالت فيديريكا نيكولاردي، عالمة البرديات: “إن تقنيات الرؤية الحاسوبية الجديدة التي تهدف إلى الكشف فعليًا عن برديات هيركولانيوم غير المفتوحة توفر أملًا جديدًا لعلم البرديات في هيركولانيوم، مما يتيح قراءة القوائم التي تمت قراءتها آخر مرة منذ ألفي عام تقريبًا قبل ثوران بركان جبل فيزوف”. في جامعة نابولي فيديريكو الثاني وعضو في فريق علم البرديات في تحدي فيزوف، في رسالة بالبريد الإلكتروني إلى جيزمودو.
قام فريق يضم بعض أعضاء تحدي فيزوف بإجراء تجربة تجريبية للتكنولوجيا في عام 2015 باستخدام لفافة من En-Gedi؛ تضمن هذا العمل إجراء مسح حجمي ثلاثي الأبعاد للتمرير، وكشف عن هيكله ثلاثي الأبعاد. بعد ذلك، قامت برامج الكمبيوتر بفهم كل طبقة ملفوفة داخل اللفافة ووحدات البكسل الأكثر سطوعًا في المسح الضوئي والتي تمثل الحبر الذي لا يزال متبقيًا على السطح. وأخيرًا، تم “فك غلاف” اللفافة تقريبًا وتم وضع النسخة الرقمية من الوثيقة بطريقة قابلة للقراءة.
هدف تحدي فيزوف لعام 2024 هو قراءة 90% من اللفائف الممسوحة ضوئيًا للفريق. هناك جوائز نقدية لفك رموز الحروف الأولى في بعض اللفائف بالإضافة إلى جائزة أكبر للتجزئة الآلية لإحدى اللفائف. إذا تمت ترجمتها، فستكون هذه هي المرة الأولى التي تتم فيها قراءة اللفائف منذ دفنها في الرماد.
لماذا الباحثون يحتاج الذكاء الاصطناعي لقراءة اللفائف؟
“قالت ثيا سومرشايلد، عالمة الكلاسيكيات بجامعة نوتنغهام وليست عضوًا في تحدي فيزوف، في اتصال مع جيزمودو: “المشكلة الكبيرة في التعامل مع النصوص القديمة هي أن حالة الحفاظ على هذه النصوص غالبًا ما تكون مجزأة”. “التعلم الآلي جيد للغاية في تحديد الأنماط، دعنا نقول الأنماط النصية، وتسخيرها لتنفيذ مهام معينة.”
في الكلاسيكيات، يعمل الذكاء الاصطناعي على تسريع وتوسيع نطاق العمليات التي كان البشر يقومون بها سابقًا بشق الأنفس. وفي حالة برديات هيركولانيوم، تأتي تلك المهام في أشكال قليلة.
قال المتسابقون: “لقد اكتشف المتسابقون كيفية تحديد المناطق داخل اللفافة المغلقة التي من المحتمل أن تكون حبرًا، ثم قاموا ببناء مجموعة ملصقات تسمح لهم بالحصول على الحبر باستخدام شبكة عصبية تلافيفية، ثم في النهاية شبكة على شكل محولات”. برنت سيلز، عالم الكمبيوتر في جامعة كنتاكي والباحث الرئيسي في مختبر Educe، في مكالمة هاتفية مع Gizmodo.
ببساطة، الشبكة العصبية التلافيفية هي مجموعة من نماذج التعلم الآلي التي تعتمد على التعلم العميق للمهام. تعد الشبكات العصبية التلافيفية مفيدة بشكل خاص في التصنيف والمهام القائمة على رؤية الكمبيوتر، ومن هنا فائدتها في التعامل مع بقايا الحبر الباهتة على ورق البردي المتفحم.
قال سيلز: “يمكنك التفكير في هذا النهج كنوع من النهج التنقيطي”. “نحن ننظر إلى مجلدات فرعية صغيرة جدًا على السطح، ونتخذ قرارًا بشأن ما إذا كانت تلك القطعة الصغيرة عبارة عن حبر أم لا.”
المحولات هي تقنية ذكاء اصطناعي أحدث تمكن النماذج من التعامل مع سلاسل ضخمة من النص والتعامل مع تدفقات متعددة من البيانات بشكل أفضل. إن أنظمة الذكاء الاصطناعي “متعددة الوسائط” هذه هي التي تمكن الذكاء الاصطناعي من إنشاء صور من مدخلات النص، أو الجمع بين رؤية الكمبيوتر ومعالجة اللغة الطبيعية لقراءة صورة رسالة مكتوبة بخط اليد. (إذا كنت لا تعرف، فإن حرف “T” في “ChatGPT” يرمز إلى Transformer.)
وقال سومرشايلد: “إن المتحولات هي أحدث ما توصلت إليه علوم الكمبيوتر في الوقت الحالي بسبب قدرتها التي لا مثيل لها على التقاط السياق”، وهو ما “مفيد في استعادة النصوص المجزأة القديمة” بالإضافة إلى تأريخها والتنبؤ بمكان كتابتها.
إن رؤية الكمبيوتر ليست مجال الذكاء الاصطناعي الوحيد الذي يعمل في الكلاسيكيات
إن تحدي فيزوف هو مجرد نهج واحد يتبعه الباحثون لنشر الذكاء الاصطناعي في دراسة النصوص القديمة.
في عام 2019، طورت سومرشيلد وشريكها في مشروعها يانيس أسيل، عالم الأبحاث في Google DeepMind، نموذج بيثيا، وهي شبكة عصبية كانت على أحدث طراز في ذلك الوقت، ومصممة لاستعادة النصوص اليونانية القديمة. فعلت بيثيا ذلك من خلال استعادة الأحرف من النصوص التالفة؛ كان لدى بيثيا معدل خطأ في الحروف يبلغ 30.1%، مقارنة بمعدل خطأ قدره 57.3% لدى كتاب النقوش البشرية.
منذ ذلك الحين، نشر فريق سومرشايلد وأسيل نموذج إيثاكا الأقوى القائم على المحولات، والذي يستخدم الشبكات العصبية لاستعادة النصوص القديمة وإسنادها. وكما كتب الفريق في عملهم، فإن إيثاكا “مصممة لمساعدة وتوسيع سير عمل المؤرخ”. وقد حقق النموذج وحده دقة بنسبة 62% في استعادة النصوص التالفة، كما وجد الفريق، لكنها دقة المؤرخين استخدام وقفزت نسبة إيثاكا من 25% إلى 72%. وكتب الفريق أن إيثاكا والنماذج المشابهة لها “يمكنها إطلاق العنان لإمكانات التعاون بين الذكاء الاصطناعي والمؤرخين”.
في ورقة 2024 في اللغويات الحاسوبية، نشر فريقهم مسحًا شاملاً للبحث حول النصوص القديمة باستخدام التعلم الآلي. وقد وجدوا زخمًا متزايدًا لهذا البحث، بدءًا من أعمال الرقمنة والترميم والإسناد إلى التحليل اللغوي والنقد النصي والترجمة.
ومع ذلك، حدد الباحثون أيضًا العقبات التي يجب التغلب عليها. أبرزت بياناتهم أن اللغات والتواريخ والمناطق الجغرافية المختلفة ممثلة بنسب مختلفة في الأبحاث الحالية باستخدام التعلم الآلي على النصوص القديمة. قد تتخيل: تم تمثيل النصوص اليونانية واللاتينية القديمة بشكل أكبر بكثير من النصوص الأخرى، بما في ذلك الكتابة المسمارية والكورية القديمة والنص الهندي. من الواضح أن العمل على ضمان تمثيل جميع الثقافات عندما ينشر الباحثون التعلم الآلي على النصوص القديمة هو عمل باحثين بشريين، وليس النماذج نفسها.
إبقاء البشر في الحلقة
وسط الضجة حول تحدي فيزوف، من السهل أن ننسى حقيقة أساسية: الذكاء الاصطناعي نفسه لا يقرأ اللفائف. وهذا لا يقلل من عمل الفريق؛ إذا كان أي شيء، فإنه يؤكد عليه. لا يعتمد الباحثون على الذكاء الاصطناعي عندما لا يكون ذلك منطقيًا، أو عندما يؤدي ذلك إلى نتائج غير دقيقة حول محتويات اللفائف.
قال سيلز: “إن إطار عمل الذكاء الاصطناعي لا يتخذ قرارًا بشأن نموذج الرسالة الكامل”. إنه ببساطة يسلط الضوء على المكان الذي يرى فيه الحبر في اللفائف، مما “يقلل من احتمالية الهلوسة”. بمعنى آخر، هذا يمنع نموذج الفريق من الخلط بين إيتا وثيتا، مما يؤدي إلى خلط المعنى الموجود في ورق البردي.
وأضاف: “إن الإنسان هو الذي يرى كيف تصطف كل قرارات الحبر الفردية هذه وما إذا كانت منطقية ككتابة أم لا”.
قال سومرشايلد: “في اللحظة التي تبدأ فيها تطبيق هذه التقنيات على اللغات القديمة، فإنك تدرك بشكل نقدي عيوبها وإمكاناتها”. “الإجابة هي أنك تحتاج فقط إلى إبقاء الإنسان على اطلاع”.
لا يزال هناك الكثير من العمل الذي يتعين القيام به
في وقت سابق من هذا الشهر، نظم سومرشايلد وأسيل ورشة عمل التعلم الآلي للغات القديمة (ML4AL) لتشجيع التعاون ودعم زخم البحث في هذا المجال.
“أنت بحاجة إلى مشاركة الخبراء، أو الطلاب، أو الممارسين، أو مجتمعات المتاحف، أو عامة الناس، للاستفادة منها، واستخدامها، واستكشاف الأخطاء وإصلاحها، وكسرها، ومحاولة الحصول على أفضل النتائج حقًا. وأضاف سومرشايلد.
بالنسبة لتحدي فيزوف، فإن الخطوة التالية هي بناء سير عمل لتجزئة ومسح اللفائف على نطاق واسع حتى يمكن قراءتها بكفاءة. هناك حوالي 300 مخطوطة موجودة ليعملوا عليها، ويجب نقل المستندات (مع القائمين على الحفظ كمعالجين) إلى مسرع الجسيمات في إنجلترا ليتم مسحها ضوئيًا. أخيرًا، تكلفة مسح جميع اللفائف اليوم ستكون 30 مليون دولار.
أما بالنسبة لسؤالك الملح – ماذا يمكننا أن نفعل في الواقع؟ يتعلم من هذه الوثائق الموجودة في ظل فيزوف؟ وقال نيكولاردي لموقع Gizmodo: “نتوقع العثور على المزيد من الأعمال الفلسفية التي يمكن أن تلقي الضوء على الفلسفة اليونانية، وخاصة كتب أبيقور وتلاميذه، التي فقدت نصوصها بالكامل خارج مكتبة فيلا دي بابيري”.
وهذا ليس كل شيء. وتم انتشال حوالي 1100 مخطوطة من فيلا دي بابيري في عامي 1752 و1754، وفقًا لمتحف جيتي. لكن موقع الفيلا لم يتم التنقيب فيه بالكامل، وبحسب الموقع الإلكتروني للمشروع، “فمن شبه المؤكد” أن المزيد من المخطوطات لا تزال مدفونة. التنقيب مكلف، على الرغم من أن الفريق لديه الكثير من اللفائف التي يجب التدقيق فيها قبل أن تأتي تلك اللحظة.
ومع ذلك، فإن اللفائف ليست سوى قطعة واحدة من هذا اللغز. والمهمة المطروحة هي استخدام الذكاء الاصطناعي لفهم العالم القديم بشكل أفضل، وهذا يعني إعادة النظر في الوثائق المألوفة لنا أيضًا. في حين أنه من المثير أن نتخيل قراءة ما لم تتم قراءته منذ ألفي عام، إلا أن الذكاء الاصطناعي له آثار عبر الكلاسيكيات. في بعض الأحيان، تكون القدرة على تقييم شيء ما بطريقة جديدة مفيدة تمامًا مثل رؤيتها لأول مرة.
اكتشاف المزيد من موقع دبليو 6 دبليو
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.