أرشيف الإنترنت

Internet Archives، منظمة أو هيئة غير ربحية تتمثل وظيفتها في (الاحتفاظِ بالموارد المعلوماتية المتوفرة على شبكة الإنترنت بمختلف أشكالها على هيئة مكتبة)، ويتضمن الأرشيف لقطات مستوحاة من الشبكة العالمية كالأفلام والتسجيلات الصوتية والكتب والبرمجيات وغيرها، وتتخذ مقرًا لها في ربوع ولاية “سان فرانسيسكو” وتحديدًا في بريسيديو، أما النسخة الوحيدة الثانية من أرشيف الإنترنت فتتواجد في “مكتبة الإسكندرية الجديدة” في جمهورية مصر العربية، وتنضم هذه الهيئة لعضوية رابطة المكتبات الأمريكية المعترف بها رسميًا.

كما يمكن اعتبار أرشيف الإنترنت بأنه بمثابةِ ذاكرة ترصد كافة الصفحات الإلكترونية الموجودة على الشبكة العنكبوتية بما فيها من محتوى سواء كان وسائط متعددة أو مقروء أو غيرها، ويتخذ هذا الأرشيف ترتيبًا يتمثل بـ 262 بين المواقع الإلكترونية وفقًا لأليكسا سنة 2018، ويحقق عائدات مادية تصل إلى 14 مليون دولار أمريكي تبعًا لتقديرات عام 2015م.

نشأة مشروع أرشيف الإنترنت

لمعت فكرة إنشاء مشروع أرشيف الإنترنت في رأس مهندس الحاسوب ورائد الأعمال الأمريكي “بروستر كاهل” في غضونِ شهر مايو من سنة 1996م، ومع حلول سنة 2002م أُبرِمت اتفاقية مع مكتبة الإسكندرية الجديدة لتتضمن الأخيرة نسخة احتياطية ضخمة من المحتوى المؤرشف، وقد ترتب على الاتفاقية ما يأتي:

  • إنشاء موقعين متشابهين تمامًا لأرشيف الإنترنت في المكتبة.
  • إهداء الجيل الأول من الأجهزة المستخدمة من الأرشفة لمكتبة الإسكندرية، والتي تتمثل وظيفتها بأرشفة المواقع الإلكترونية سنة 2002م.
  • الاحتفاظ بنسخة من أرشيف الإنترنت بدءًا من 1996-2001.
  • استحداث بنية تحتية تستوعب نحو 1.5 بيتا بيت عوضًا عن 100 تيرا بيت وبتصميمٍ أحدث مما كانت عليه.
  • إضافة سعة إضافية تصل إلى 4.1 بيتا بيت للمكتبة مع حلول سنة 2008م، وذلك بواسطة أجهزة مصنوعة محليًا.
  • ارتفاع السعة التخزينية حتى الوقت الحالي لتصبح 4.9 بيتا بايت من البيانات المتنوعة.
  • الاستخدام لا يقتصر على أرشفة الإنترنت فحسب؛ بل يشمل أيضًا المواد الرقمية بمختلف أشكالها.
  • الوصول إلى الأرشيف المحفوظ في مكتبة الإسكندرية يمكن أن يتم بواسطة ما يعرف باسم WayBack Machine.

محرك واي باك “WayBack Machine”

يطلق عليها أيضًا تسمية “آلة العودة بالزمن”، وهي خدمة متخصصة بأرشفة محتوى الويب، وقد استوحيت التسمية والفكرة من برنامج كرتوني يعرف باسم The Adventure of Rocky and Bullwinkle، وقد جاء في أحداث هذا الفيلم الكرتوني آلة اعتُبِرت آلة العودة بالزمن للوراء تحت مسمى WABAC Machine، ومن هنا لمعت فكرة التسمية بواي باك..

وتتمثل أهمية خدمة WayBack Machine بأنها فرصة لتمكين مرتادي شبكة الإنترنت من استخدام ما تم أرشفته من مواقع ويب وصفحات إلكترونية بعد فهرستها؛ فيصبح البحث أكثر سهولة من أي وقتٍ مضى، ومن الممكن أن تُعرض هذه الصفحات بشكلٍ مجاني للمستخدمين، وتشير المعلومات إلى أن هناك حلقة تعاون بين أرشيف الإنترنت وموقع أليكسا لضمان تنفيذ المشروع على أكمل وجه؛ وذلك من خلال تطوير واستحداث مؤشر ثلاثي الأبعاد يُمكّن المستخدمين من تصفح شبكة الإنترنت ومحتوياتها المؤرشفة.

معلومات حول أرشيف الإنترنت

من أهم المعلومات حول أرشيف الإنترنت ما يلي:

  • الاحتفاظ بكمٍ هائل من المحتويات يتجاوز أعدادها المليون صفحة ويب تقريبًا.
  • السماح بالوصول إلى المحتويات القديمة في النسخ وصفحات الويب الحالية أيضًا.
  • ظهور تحيزات دولية في سنة 2004م تبعًا لمدى تغطية الخدمة، لذلك فإن ذلك يتسبب بفقدان أجزاء كبيرة من المحتويات.
  • إدراج المواقع الإلكترونية وصفحات الويب ضمن نطاق قواعد البيانات أصبح فوريًا، وقد جاء ذلك بعد أن كان يتطلب الأمر انتظارًا لفترة زمنية تتفاوت ما بين 6-18 شهر على الأقل.
  • الوصول إلى الأرشفة الفورية متاح منذ عام 2013م، وذلك بالنقرِ على الجزء السفلي الأيمن ضمن نطاق الصفحة الرئيسية، إذ يصار إلى إدراج المحتوى بشكلٍ مباشر إلى قواعد البيانات.
  • من أبرز أنواع الخدمات المعتمدة في أرشيف الإنترنت في قواعد البيانات أرشفة النصوص: تتوفر نسخ رقمية للكتب في قواعد البيانات المؤرشفة إلى جانب محتويات تخص مؤسسات التراث الثقافي والمكتبات الكبرى حول العالم.
  • إقامة علاقة تعاون بين مايكروسوفت وأرشيف الإنترنت لغايات تسهيل البحث عن الكتب، وحملت الخدمة تسمية “Live Search Books”، وقد شمل المشروع مسح ما يفوق 300 ألف كتاب مضافة إلى التجميعة الرئيسية في الأرشيف.
  • إيقاف المشروع التعاوني بين أرشيف الإنترنت ومايكروسوفت نهائيًا في اليوم 23 من شهر مايو سنة 2008م.
  • ميزانية منظمة أرشيف الإنترنت تتجاوز 10 مليون دولار سنويًا يتم الحصول عليها من عددٍ من المصادر.
  • نشأة مشروع الأرشيف قد جاءت بالتزامنِ مع نشأة أليكسا للوصول إلى صفحات الويب.

يحتوي الأرشيف في الوقت الحالي على الأرقام أدناه:

  1. 330 مليار صفحة ويب مؤرشفة.
  2. 4.5 مليون تسجيل صوتي، ويدرج تحتها نحو 180 ألف حفل موسيقي.
  3. 4 ملايين فيديو، تتضمن أيضًا 1.6 مليون فيديو مأخوذة من برامج إخبارية تلفزيونية.
  4. 20 مليون كتاب.
  5. 200 ألف برنامج للبرمجيات.
  6. 3 ملايين صورة.

من الممكن لأي شخص تحميل الوسائط الخاصة به إلى أرشيف الإنترنت في حال امتلاكه حسابًا مجانيًا خاصًا، وتعد الكتب هي الأكثر أهمية على الإطلاق باعتبار القائم بالعمل مكتبة، وتسعى المنظمة لرقمنة الكتب بشكلٍ تام منذ انطلاقة مشروعها سنة 2005م.

المراجع: 1 2 3 4

شـاهد أيضاً..

20 من أهم مصطلحات الإنترنت الشائعة