ما هو الجيل المعزز بالاسترجاع (RAG)؟

اكتشف كيف يدمج RAG الاسترجاع مع التوليد لتعزيز دقة الذكاء الاصطناعي.

سنغطي ما يلي...

تخيّل عالم حاسوب متمرسًا مُلِمًّا بأوراق بحثية لا تُحصى، ولغات برمجة، ومسائل مُعقّدة في مجالات حيوية كالخوارزميات والتعلم الآلي. على الرغم من معرفته الواسعة، قد لا يكون مُلِمًّا بكلّ التطورات التكنولوجية الجديدة، مما يُظهر فجواتٍ تُشكّلها تجاربه الفريدة وفترة تدريبه الأولي.

وبالمثل، تعكس نماذج الأساس، مثل نماذج اللغة الكبيرة، هذا السيناريو. إذ تعتمد هذه النماذج على مجموعات بيانات واسعة ولكنها ثابتة، وغالبًا ما تعكس عدم اكتمال البيانات وحداثتها وانحيازاتها. ورغم قدرتها على توليد معلومات معقولة، إلا أنها قد تُنتج استجابات قديمة أو ناقصة، وقد تُنتج تفاصيل معقولة وإن كانت غير صحيحة - وهي ظاهرة تُعرف باسم الهلوسة . أما الطرق التقليدية، مثل الكون المثالى يتضمن الضبط الدقيق إجراء تعديلات طفيفة على معلمات النموذج المدرب مسبقًا لتكييفه مع مهمة محددة ولكن ذات صلة، مما يعزز أدائه على بيانات جديدة ولكن مماثلة. أو إعادة التدريب يشير إعادة التدريب إلى عملية تدريب نموذج جديد على مجموعة بيانات مختلفة أو بعد تحديثات كبيرة لبيانات التدريب الأولية، وهو في الأساس إعادة تعلم الأنماط من الصفر لتناسب المتطلبات الجديدة أو تصحيح الأخطاء السابقة. إن تحديث هذه النماذج يتطلب موارد مكثفة ولا يتغلب دائمًا على هذه القيود بشكل فعال.

وهنا يأتي دور توليد البيانات المعزز بالاسترجاع.

ما هي المكونات مفتاح لـ RAG؟

التوليد المعزز بالاسترجاع (RAG) هو تقنية أو نموذج هجين متقدم يدمج عنصر استرجاع ضمن نموذج توليدي. عمليًا، يعني هذا أنه عند مطالبة نموذج RAG بإنشاء نص أو إجابة سؤال، فإنه يسترجع أولًا المعلومات ذات الصلة من قاعدة بيانات ضخمة. ثم يستخدم هذا السياق إدخال مباشر لتوجيه عملية التوليد وتزويدها بالمعلومات، مما يُنشئ استجابات مبنية على بيانات واقعية محددة بدلًا من الاعتماد كليًا على المعرفة المُدرَّبة مسبقًا. يتيح هذا النهج الديناميكي لنماذج RAG إنتاج مخرجات أكثر دقةً وتوقيتًا وملاءمة للسياق، مما يقلل بشكل كبير من حدوث الأخطاء والهلوسات الشائعة في النماذج التقليدية.

Press + to interact
How RAG works
How RAG works

فيما يلي كيفية معالجة نموذج RAG للاستعلام: ...