Naive RAG: أبسط تكامل استرجاعي-توليدي
تعرف على RAG الساذج، وكيفية تنفيذه باستخدام LangChain، وقيوده.
سنغطي ما يلي...
لقد استكشفنا أساسيات RAG وكيف يعالج قيود برامج ماجستير إدارة الأعمال. دعونا نتعمق في مختلف هياكل أو نماذج أنظمة RAG واحدًا تلو الآخر، بدءًا بدراسة RAG البسيطة بالتفصيل.
ملخص
Naive RAG هو نهج مُبسّط لاستخدام أنظمة إدارة قواعد البيانات (LLM) بالتزامن مع استرجاع المستندات لتحسين الوصول إلى المعلومات وتوليد استجابة . يعمل Naive RAG بثلاث خطوات أساسية:
الفهرسة: تُنقّى البيانات من صيغ مثل PDF أو HTML وتُحوّل إلى نص عادي. ثم يُقسّم هذا النص إلى أجزاء أصغر (كتل) ويُحوّل إلى تمثيلات متجهية عن طريق تمرير هذه الأجزاء إلى نموذج التضمين لتسهيل العثور عليها لاحقًا.
Retrieval: When someone asks a question, the RAG system turns that question into vector embedding using the same method used in indexing. Then, it compares this vector to the vectors of the indexed text parts to find the
most similar chunks. These most similar chunks are used in the next step as a context. التوليد: يجمع النظام أجزاء النص المُسترجعة (السياق) مع السؤال الأصلي لإنشاء مُحفِّز. يستخدم نموذج اللغة هذا المُحفِّز للإجابة على السؤال. بناءً على السؤال، قد يستخدم النموذج معرفته الخاصة أو يُركِّز على المعلومات التي وجدها سابقًا.