فهرسة HNSW في قواعد بيانات المتجهات لتحسين الأداء
تعرف على HNSW، وهي طريقة فهرسة شائعة تُستخدم في قواعد بيانات المتجهات للبحث الفعال.
التحدي المتمثل في البحث في مجموعات البيانات الكبيرة
تخيل أننا بحاجة إلى إيجاد تمثيلات متشابهة لاستعلام من بين مجموعة ضخمة من التمثيلات المخزنة محليًا أو في قاعدة بيانات. بدون أي آلية فهرسة، سيتضمن هذا البحث مقارنة تمثيل الاستعلام بكل تمثيل مخزن على حدة، مما ينتج عنه عملية بحث تستغرق وقتًا خطيًا يتناسب مع العدد الإجمالي للتمثيلات. بالنسبة لمجموعات البيانات الكبيرة، كتلك الموجودة على شبكة الإنترنت العالمية، سيتطلب ذلك مقارنة شاملة، مما يجعل العملية بطيئة للغاية وغير عملية.
فهرسة لتسريع عمليات البحث
تستخدم قواعد البيانات الفهرسة لتسريع عملية البحث. الفهرسة هي عملية تنظيم البيانات لتحسين سرعة وكفاءة عمليات الاسترجاع. يعمل الفهرس كخريطة طريق أو مؤشر يساعد على تحديد موقع البيانات المطلوبة والوصول إليها بسرعة دون الحاجة إلى البحث في مجموعة البيانات بأكملها بشكل متسلسل. تخزن قواعد بيانات المتجهات البيانات على نموذج متجهات، حيث يمثل كل متجه نقطة في فضاء متعدد الأبعاد. يهدف استخدام الفهرسة في قواعد بيانات المتجهات إلى إيجاد المتجهات المشابهة أو الأقرب إلى متجه استعلام معين بسرعة.
تستخدم قواعد البيانات التقليدية أساليب فهرسة مثل أشجار B وجداول التجزئة ، وهي مناسبة تمامًا لأنواع البيانات العددية. صُممت أساليب الفهرسة هذه لإجراء عمليات بحث فعالة عن التطابق التام والاستعلامات النطاقية. من ناحية أخرى، تستخدم قواعد بيانات المتجهات أساليب فهرسة متخصصة مُحسَّنة للمساحات عالية الأبعاد، مثل
الرسم البياني الهرمي القابل للتنقل في العالم الصغير (HNSW)
تُعدّ رسوم HNSW البيانية هياكل بيانات متقدمة مصممة للبحث عن أقرب جار تقريبي (ANN). وهي تجمع بين مفاهيم الرسوم البيانية ذات العالم الصغير القابلة للتصفح وقوائم التخطي للبحث والتنقل بكفاءة في مجموعات البيانات الكبيرة.
رسم بياني للعالم الصغير قابل للتصفح (نيو ساوث ويلز)
تُعدّ رسوم بيانية العالم الصغير القابلة للتصفح (NSW) هياكل بيانات تُسهّل البحث والتصفح بكفاءة في مجموعات البيانات الكبيرة، وخاصةً في البحث باستخدام الشبكات العصبية الاصطناعية. ينبع مفهوم "العالم الصغير" في رسوم بيانية العالم الصغير القابلة للتصفح من "ظاهرة العالم الصغير" في نظرية الشبكات الاجتماعية، والتي تشير إلى ملاحظة إمكانية الوصول إلى معظم العقد في شبكة كبيرة من أي عقدة أخرى.
يعني التكتل العالي أن العقد تتجمع بإحكام، ما يعني أنه إذا كانت ...