ضمان بساطة الوكيل ومتانته

تعرف على كيفية اختبار ومراقبة أنظمة الوكلاء المتعددين في CrewAI.

سنغطي ما يلي...

لنبتعد قليلاً عن الحديث التقني، ولنتخيل أنفسنا مدربًا لفريق رياضي. لكل عضو من أعضاء فريقك (الوكلاء) دوره - بعضهم نجوم، والبعض الآخر متخصصون بمهارات محددة. لكن بصفتك مدربًا لهم، فأنت تعلم أن السر يكمن في العمل الجماعي الجماعي. للفوز بالمباراة (أو إنجاز مشروع)، يجب أن يكون الجميع متناغمين، أليس كذلك؟ ولكن كيف نضمن أداءً جيدًا لفريقك؟ الأمر بسيط: نختبرهم ثم نراقب أدائهم لتحديد ما ينجح وما يحتاج إلى تحسين. وهذا ما سنفعله مع فرقنا أيضًا.

كيفية اختبار الطواقم

قبل إرسال فريقنا إلى أرض الملعب للمباراة الكبرى، نُجري تدريباتٍ تدريبية للتأكد من أدائهم بأفضل شكل. في CrewAI، يعمل الاختبار بالطريقة نفسها. نُجري اختباراتٍ على مهامّ وكلائنا عدة مرات، ونتحقق من أدائهم ونُحدد نقاط ضعفهم. باستخدام الأمرcrewai test يمكننا إجراء اختبارات على فريقنا بأكمله. تخيل الأمر كأنك تُجري مباريات تدريبية مع فريقك لمعرفة كيفية تعاونهم. افتراضيًا، يُجري الاختبار دورتين (تمامًا مثل إعطاء فريقك جولتين تدريبيتين)، ولكن يمكننا تعديل ذلك إذا أردنا إجراء المزيد من التدريبات. ولكن ماذا لو أردتَ معرفة أداء الفريق تحت ضغط أكبر؟ الأمر سهل - يمكنك زيادة عدد التكرارات:

crewai test --n_iterations 3
Testing crews

سيُدرّب هذا الأمر فريقنا على ثلاث جولات، وفي النهاية، سنحصل على بطاقة أداء تُظهر أداء كل لاعب. لنفترض أنك اختبرت مهمتين: المهمة 1 (الدفاع عن المرمى) والمهمة 2 (تسجيل النقاط). قد تبدو بطاقة الأداء كما يلي:

Task Scores
(1-10 Higher is better)
┏━━━━━━━━━━━━┳━━━━━━━┳━━━━━━━┳━━━━━━━┳━━━━━━━━━━━━┓
┃ Tasks/Crew ┃ Run 1 ┃ Run 2 ┃ Run 3 ┃ Avg. Total ┃
┡━━━━━━━━━━━━╇━━━━━━━╇━━━━━━━╇━━━━━━━╇━━━━━━━━━━━━┩
│ Task 1 │ 10.0 │ 9.0 │ 9.0 │ 9.33 │
│ Task 2 │ 9.0 │ 9.0 │ 8.5 │ 8.83 │
│ Crew │ 9.5 │ 9.0 │ 8.7 │ 9.07 │
└────────────┴───────┴───────┴───────┴────────────┘
Testing output
    ...