مقدمة إلى RAG

تعرف على RAG وكيف يساعد برامج المحادثة الآلية في تأسيس نماذج LLM من خلال الاستفادة من البيانات الخارجية.

سنغطي ما يلي...

Retrieval-augmented generation for efficient chatbots

نماذج اللغات الكبيرة قوية، لكنها تعاني من عدة مشاكل، منها الهلوسة، والتعامل مع بيانات قديمة أو بيانات ذات تاريخ انتهاء الصلاحية، ونقص الشفافية. لمواجهة العديد من هذه التحديات، برزت RAG في العامين الماضيين كحلٍّ لتعزيز وتمكين نماذج اللغات الكبيرة وتفاعلات روبوتات الدردشة. باختصار، تُدمج RAG قواعد بيانات خارجية، أو وثائق، أو مصادر إلكترونية، بالإضافة إلى النماذج المُدرَّبة مسبقًا، لتعزيز المعرفة الحالية في برنامج ماجستير القانون.

تُظهر الصورة أدناه التقاطعات المختلفة بين استعلام المستخدم أو نيته، ونماذج اللغة الكبيرة، والمستندات الخارجية أو مصادر البيانات. عند تقاطع الاستعلام مع نموذج اللغة الإنجليزية، تنشأ هلوسات مرتبطة استجابة المُولّدة من نموذج اللغة. يمكن لنماذج اللغة الإنجليزية أن تُولّد استجابات غير دقيقة أو مضللة بثقة عالية.

Press + to interact
RAG intersections
RAG intersections

عند تقاطع نماذج اللغات الكبيرة مع المستندات الخارجية أو مصادر البيانات، لدينا نماذج LLM مُحسّنة. مع أن نماذج LLM المُحسّنة فعّالة ومتقدمة في استجاباتها نظرًا لاعتمادها على مهام محددة، إلا أنها ليست الإطار الأمثل. يتطلب التحسين كمية كبيرة من البيانات لتدريب النموذج، والتي قد لا يكون من السهل الحصول عليها، كما أنها تتطلب قوة حسابية عالية ووحدات معالجة رسومية (GPUs) لتدريب النموذج، بالإضافة إلى تكلفة إعادة تدريبها الباهظة.

عند تقاطع المفاهيم الثلاثة يوجد RAG، الذي يجمع بين استعلام المستخدم أو نيته، ونموذج اللغة الكبيرة المدرب مسبقًا، ومجموعة من المستندات أو المصادر الخارجية.

  • يحل RAG مشكلة تحديث المعلومات في نموذج LLM. يتم تدريب نماذج LLM ونشرها في وقت محدد، وبعد ذلك لا يمكن استرجاع أي بيانات أو معلومات جديدة تظهر بعد هذا التاريخ. وهنا يُسهّل RAG إدخال بيانات جديدة في نموذج LLM المُدرّب مسبقًا دون الحاجة إلى إعادة تدريبه.

  • طُرح نظام RAG في منتصف عام 2020، ويُمثل نموذجًا لتحسين المهام التوليدية وروبوتات الدردشة المتقدمة، وهو الحل الأمثل للتعامل مع هلوسات LLM. في سياق روبوتات الدردشة، تشير الهلوسات إلى توليد استجابات لا تستند إلى الواقع أو البيانات المُقدمة. تتراوح هذه الاستجابات بين عدم الدقة والبيانات المُلفقة تمامًا، مما قد يُفقد المستخدم ثقة النظام. لا يقتصر نظام RAG على تحديث وإثراء معرفة النموذج دون الحاجة إلى إعادة تدريب مكثفة، بل يوفر أيضًا آليةً لتأسيس الاستجابات على معلومات مُتحقق منها، مما يزيد من الدقة والموثوقية.

شهد دمج RAG في برامج الماجستير في القانون (LLM) تبنّيًا سريعًا. وأصبح مرجعًا في تحسين قدرات برامج الدردشة الآلية وجعل برامج الماجستير في القانون أكثر قابلية للتطبيق العملي.

Advantages of using RAG in chatbot interactions

  • الصلة السياقية : تُنتج RAG استجابات مبنية على بيانات واقعية، مما يجعلها أكثر دقةً وارتباطًا. على سبيل المثال، روبوت دردشة لحجز السفر يستخدم RAG لجمع ...