تقنيات التفكير المتقدمة
تعرف على كيفية استخدام تقنيات الاستدلال المنطقي المتقدمة لتوجيه الذكاء الاصطناعي خلال حل المشكلات المعقدة.
يتم تدريب طلاب ماجستير القانون على توقع رمز التالي، وهي عملية تُمكّنهم من توليد نص بكفاءة وسلاسة. يُعد هذا السلوك ميزةً للعديد من المهام. أما بالنسبة للمسائل التي تتطلب تفكيرًا متعدد الخطوات، فقد يُصبح هذا السلوك قيدًا، لأن النموذج قد يُنتج استنتاجًا معقولًا ولكنه غير صحيح. تأمل اللغز الكلاسيكي التالي:
Riddle: A bat and a ball cost $1.10 in total. The bat costs $1.00 more than the ball. How much does the ball cost? |
استجابة النموذجية السريعة والبديهية من النموذج هي 0.10 دولار. يبدو هذا صحيحًا للوهلة الأولى، ولكنه غير صحيح. إذا كان سعر الكرة 0.10 دولار، فسيكون سعر المضرب 1.10 دولار، والمجموع 1.20 دولار. تُسلّط هذه المسألة البسيطة الضوء على نقطة مهمة: في التفكير المعقد، نحتاج إلى حثّ النموذج على اتباع الخطوات بوضوح. سنتناول بعد ذلك كيفية القيام بذلك عمليًا.
التحفيز بسلسلة الأفكار (CoT)
إن أهم إنجاز في مجال التفكير في ماجستير القانون هو تقنية تُسمى "التحفيز التسلسلي للأفكار" (CoT). وهي تقنية أساسية تُوسّعها أو تُكمّلها العديد من الأساليب المتقدمة.
سلسلة الأفكار هي تقنية تحفيز تُشجّع طالب الماجستير في القانون على توليد سلسلة من خطوات التفكير الوسيطة والمترابطة التي تُفضي إلى الحل النهائي لمشكلة متعددة الخطوات. فبدلاً من إنتاج إجابة نهائية مباشرة، يُطبّق النموذج عملية التفكير خارجيًا. وهذا يُحاكي النهج البشري في تقسيم المشكلة المعقدة إلى أجزاء أصغر وأسهل إدارة، مما يُقلل بشكل كبير من احتمالية أخطاء التفكير.
هذه التقنية فعّالة للغاية لأنها تُوائِم عملية توليد النموذج مع مسار التفكير المنطقي. تُوفّر كل خطوة في السلسلة سياقًا للخطوة التالية، مما يُوجِّه النموذج نحو استنتاج صحيح. هناك طريقتان رئيسيتان لاستخلاص هذا السلوك من النموذج:
صفر طلقة CoT
CoT قليل اللقطات
صفر طلقة CoT
أبسط طريقة لتطبيق نظرية المعرفة هي من خلال نهج "صفر شوت" . تعتمد هذه الطريقة على تدريب النماذج الحديثة واسعة النطاق على كميات هائلة من النصوص التي تتضمن حلًا تدريجيًا للمشكلات. ونتيجة لذلك، تتمتع هذه النماذج بقدرة كامنة ومدمجة على التفكير المنطقي، يمكن إطلاقها بعبارة تحفيز بسيطة.
التقنية واضحة: بعد ذكر المشكلة، نضيف عبارة تدفع النموذج إلى إظهار منطقه، مثل "دعونا نفكر خطوة بخطوة".
دعونا نطبق هذا مباشرة على مشكلتنا التمهيدية.
Prompt: A bat and a ball cost $1.10 in total. The bat costs $1.00 more than the ball. How much does the ball cost? Let's think step by step. |
Output: 1. Let B be the cost of the bat and C be the cost of the ball. 2. The problem gives us two pieces of information that we can turn into equations: a) The total cost is $1.10, so: B + C = 1.10 b) The bat costs $1.00 more than the ball, so: B = C + 1.00 3. Now I can solve this system of equations. I will substitute the second equation into the first one. 4. This gives me: (C + 1.00) + C = 1.10 5. Combining the terms with C, I get: 2C + 1.00 = 1.10 6. Subtracting 1.00 from both sides gives: 2C = 0.10 7. Finally, dividing by 2 gives: C = 0.05 Therefore, the ball costs $0.05. |
ومن خلال إضافة تلك العبارة البسيطة، قمنا بتحويل المطالبة من سؤال بسيط إلى طلب لعملية منطقية، وتوجيه النموذج بعيدًا عن تخمينه البديهي غير الصحيح ونحو الإجابة الصحيحة.
CoT قليل اللقطات
على الرغم من فعالية نموذج CoT ذي اللقطة الصفرية، إلا أنه يعتمد على تعلم النموذج كيفية تحليل هذا النوع من المشكلات أثناء التدريب. بالنسبة للمهام الجديدة أو الأكثر تعقيدًا، يوفر نموذج CoT ذي اللقطة القليلة طريقة أكثر موثوقية لتوجيه تفكير النموذج.
في هذه التقنية، نُقدّم مثالًا واحدًا أو أكثر ضمن المُوجّه لتوضيح نمط التفكير المطلوب. هذا يُعطي النموذج مخططًا واضحًا ليتبعه. يرى النموذج مثالًا على سؤال، والخطوات اللازمة لحلّه، والإجابة النهائية. ثم ...