إطلاق ميزات ذكاء اصطناعي يثق بها الناس
النموذج هو الجزء السهل. الثقة تأتي من حواجز الأمان، والفشل اللطيف، والصدق بشأن ما لا يعرفه النظام.
لم يكن ربط نموذج لغوي بمنتجٍ أسهل مما هو عليه الآن، ولم يكن فعل ذلك بمسؤولية أصعب. العرض التقديمي يأخذ بعد ظهر؛ أما الثقة فتأخذ بقية المشروع. لمشغّل خدمات لوجستية إقليمي بنينا مساعداً يصوغ إشعارات استثناءات الشحنات — ولم يكن معظم العمل متعلقاً بالنموذج، بل بالنظام المحيط به.
قيّد قبل أن تولّد
التوليد المفتوح عبء في أداة تشغيلية. نحصر مهمة النموذج في أصغر سطح مفيد: مدخلات مهيكلة، ومخطط صارم للمخرجات، وتحقق يرفض كل ما هو خارج الشكل قبل أن يصل إلى إنسان. النموذج يقترح، والنظام يقرّر. وحين يجب أن تطابق المخرجات قائمة محدّدة أو تاريخاً أو مرجعاً معروفاً، نتحقق منها — ونفشل بصوت عالٍ بدل التخمين.
- كل مخرَج من النموذج يُتحقَّق من مخططه قبل عرضه أو تخزينه.
- الاسترجاع مبني على بيانات العميل نفسها، مع استشهادات تعود إلى السجل المصدر.
- تُسجَّل الموجِّهات والاستجابات للمراجعة تحت صلاحيات الحد الأدنى.
- عتبة ثقة توجّه الحالات غير المؤكدة إلى إنسان بدل المجازفة.
صمّم الفشل لا النجاح وحده
أسرع طريقة لفقدان ثقة المستخدم هي إجابة خاطئة بثقة. لذا نبذل جهد تصميم حقيقياً في المسار غير السعيد: حالة واضحة «لستُ متأكداً — وهذا السبب»، وتصعيد بنقرة واحدة إلى شخص، ودون إخفاء أن المسودة جاءت من نموذج. الصدق بشأن عدم اليقين ليس ضعفاً في التجربة؛ بل هو الميزة التي تجعل الناس مستعدين للاعتماد على البقية.
يسامح المستخدمون نظاماً يقول «لا أعرف»، ولا يسامحون نظاماً كان مخطئاً بثقة.
قِسها كأي نظام آخر
نتعامل مع ميزات الذكاء الاصطناعي كأنظمة فيها انحدارات، لا كسحرٍ على الإحساس. يعني ذلك مجموعة تقييم مأخوذة من حالات حقيقية (مجهّلة الهوية)، ولوحة تتابع معدلات القبول والتجاوز، وقاعدة بأن لا يُطلق أي تغيير في الموجِّه دون إعادة تشغيل التقييمات. والنتيجة غير برّاقة لكنها راسخة: ميزة تتحسّن بشكل قابل للقياس، وفريق يستطيع إثبات ذلك.