نظام الأسئلة والأجوبة للمستندات متعدد الأدوار مع LlamaIndex

تعرف على كيفية بناء مساعد محادثة يجيب على الأسئلة المتعلقة بالمستندات التي تم تحميلها باستخدام الذاكرة والاسترجاع الدلالي.

سنغطي ما يلي...

إعداد واجهة Streamlit وخط أنابيب RAG
تمكين الذاكرة للمحادثات متعددة الأدوار
إضافة إمكانية تلخيص المستندات
التعامل مع الأسئلة والأجوبة متعددة الأدوار باستخدام الذاكرة والاسترجاع
تطبيق التتبع لمراقبة سلوك النظام
تطبيق كامل: نظام الأسئلة والأجوبة للمستندات متعددة الأدوار
خاتمة

في هذا الدرس، بناء نظامًا تفاعليًا يتيح للمستخدمين تحميل مستندات PDF وطرح أسئلة باللغة الطبيعية حول محتواها. سيجمع النظام المعلومات ذات الصلة من المستندات المرفوعة، ويولد إجابات دقيقة وتفاعلية.

بالإضافة إلى الإجابة على الأسئلة الفردية، يدعم النظام التفاعلات متعددة الأدوار من خلال تذكر الاستفسارات السابقة. كما يتضمن إمكانية تلخيص مستند كامل وعرض خطوات الاستدلال الداخلي، مما يسمح للمطورين أو المستخدمين بفهم كيفية توليد كل استجابة .

يعد هذا النوع من المساعدين الذين يدركون المستندات مفيدًا في السيناريوهات الواقعية مثل مراجعة اتفاقيات الإيجار أو سياسات التأمين أو المناهج الأكاديمية أو إجراءات الشركة.

لنبدأ بتنفيذ تطبيقنا خطوة بخطوة.

إعداد واجهة Streamlit وخط أنابيب RAG

لجعل نظام الأسئلة والأجوبة للمستندات تفاعليًا، نستخدم Streamlit بناء واجهة ويب بسيطة. يمكن للمستخدمين تحميل ملف PDF واحد أو أكثر وكتابة أسئلة باللغة الطبيعية. عند إرسال سؤال، يسترجع النظام المحتوى ذي الصلة من المستندات المرفوعة ويُنشئ استجابة باستخدام نموذج لغوي.

نبدأ باستيراد المكتبات الضرورية:

if uploaded_files and "documents" not in st.session_state:
    with st.spinner("Loading and indexing documents..."):
        with tempfile.TemporaryDirectory() as temp_dir:
            for uploaded_file in uploaded_files:
                file_path = os.path.join(temp_dir, uploaded_file.name)
                with open(file_path, "wb") as f:
                    f.write(uploaded_file.getbuffer())
            docs = SimpleDirectoryReader(input_dir=temp_dir).load_data()
            idx = VectorStoreIndex.from_documents(docs, embed_model=embedding_model)
            st.session_state.documents = docs
            st.session_state.index = idx
documents = st.session_state.get("documents")
index = st.session_state.get("index")

Load and index the uploaded documents once per session

Library/Module	Purpose
LlamaIndex	Indexing, retrieval, memory, and LLM integration
Streamlit	Front-end interface for user interaction
Ollama	Local embedding model for document vectors
Groq	LLM backend to generate conversational responses

1.ابدء

2.المفاهيم الأساسية واستخدامات ماجستير القانون

3.بناء خط أنابيب RAG

4.استخراج المخرجات المنظمة من برامج الماجستير في القانون

5.الوكلاء وسير العمل

6.مراقبة وتقييم طلبات الماجستير في القانون

7.بناء تطبيقات واقعية باستخدام LlamaIndex

8.اختتام

نظام الأسئلة والأجوبة للمستندات متعدد الأدوار مع LlamaIndex

Modules and Libraries

إعداد واجهة Streamlit وخط أنابيب RAG