...

/

التضمينات ومخازن المتجهات في LangChain

التضمينات ومخازن المتجهات في LangChain

اكتشف طرقًا مختلفة لتخزين المستندات واستخدامها في تطبيقاتك مع LangChain

سنغطي ما يلي...

لنبدأ مباشرةً بأحد أهم عناصر بناء التطبيقات الذكية باستخدام LangChain: مخازن المتجهات. حتى الآن، تكون قد جربتَ نماذج اللغة لتوليد المحتوى أو الإجابة على الأسئلة. ولكن كيف نُخزّن ونسترجع بيانات النصوص بطريقة تُجسّد معناها فعليًا؟ هنا يكمن دور مخازن المتجهات.

ما هي التضمينات؟

أولاً، لنناقش التضمينات، وهي وثيقة الصلة بمخازن المتجهات. التضمين هو تمثيل رقمي للنص. سواءً كان كلمةً أو جملةً أو مستندًا كاملًا، فإن التضمينات تُحوّله إلى متجه، أي قائمة أرقام تُجسّد معناه الدلالي.

من السهل تخيل مساحة عملاقة ثلاثية الأبعاد (مع أن هذه المساحة، عمليًا، غالبًا ما تحتوي على مئات أو آلاف الأبعاد). تبدو الكلمات أو الجمل المترابطة في المعنى قريبة من بعضها البعض، بينما تبدو النصوص غير المترابطة متباعدة. على سبيل المثال، كلمة "kitten" قريبة من كلمة "cat"، لكن كليهما بعيدان جدًا عن كلمة "car".

Loading...
A sample plot for the embeddings in 3 dimensions

هذا أمرٌ بالغ الأهمية، لأن الآلات لا تعالج اللغة الإنجليزية أو أي لغة أخرى؛ بل تعالج الأرقام. بترميز الكلمات إلى متجهات تُمثل علاقاتها الدلالية، نُنشئ جسرًا بين اللغة البشرية والعمليات الرياضية التي تُتقنها الحواسيب.

توفر LangChain تكاملات مع العديد من موفري التضمين. ومن أبرز الخيارات OpenAI، الذي يوفر نماذج متطورة مثلtext-embedding-3-large إليك نظرة سريعة على كيفية استخدامه:

Press + to interact
from langchain_openai import OpenAIEmbeddings
embeddings = OpenAIEmbeddings(model="text-embedding-3-large")

في السابق، كنا نستخدم Groq للوصول إلى برنامج الماجستير في القانون الذي نختاره؛ ولكن حتى وقت كتابة هذا التقرير، لم يكن نموذج التضمين متاحًا على Groq. سنستخدم الآن OpenAI للوصول إلى مكتبة نماذجهم.

هذا كل ما يلزم للبدء. يُحمّل هذا السطر من التعليمات البرمجية نموذجًا قويًا يُحوّل نصك إلى متجهات رقمية كثيفة. سواء كنت تعمل على مقتطفات صغيرة أو مستندات أكبر، تُوفّر هذه التضمينات الأساس لتخزين بياناتك واسترجاعها بفعالية.

ما هي متاجر المتجهات؟

لقد قمتَ بتضمين نصك في متجهات. السؤال الآن: أين تحفظها، ...