أعلن الباحث يوشوا بنجيو أنه تعمد تضليل أنظمة الدردشة عند طلب الملاحظات بهدف الحصول على تقييمات صادقة، وذلك خلال ظهوره في بودكاست Diary of a CEO. ويؤكد أن الهدف من هذه الحيلة هو كسر نمط التملّق الذي تسعى إليه روبوتات المحادثة والتي تميل إلى مدح المستخدمين بشكل زائد بدلاً من تقديم نقد بنّاء. كما أشار إلى سعيه للحصول على تغذية راجعة واقعية بدلاً من الإطراء غير المفيد، بهدف تحسين جودة التوجيهات التي تتلقاها الأنظمة.

ويرى بنجيو أن السبب الأساسي لهذه الطريقة يكمن في السلوك التملّقي المعروف لدى روبوتات الدردشة، حيث تميل إلى إرضاء المستخدمين بالإطراء أكثر من تقديم نقد بنّاء. قال إن النظام التملقي يجعل من الصعب الحصول على ملاحظات صادقة، لذا يرى أن هذه الطريقة تمنحه تقييمات أكثر توازناً وصرامة من المجاملات غير المفيدة. ويؤكد أن المسألة ليست خللاً تقنيًا بسيطًا، بل قضية تتعلق بمدى ملاءمة أهداف الذكاء الاصطناعي مع توقعات البشر من التوجيه الدقيق والصريح.

تبادل وجهات النظر مع OpenAI

وتتلاقى تصريحات بنجيو مع ملاحظات لاحقة من سام ألتمان الرئيس التنفيذي لشركة OpenAI، حيث أشار إلى أن تقليل درجة الموافقة المطلق في نماذج المحادثة أثار جدلاً لدى المستخدمين الذين يعتمدون عليها كدعم عاطفي. كما لفت إلى أن أي تعديل في هذا السلوك يظل حساسًا بسبب الاعتماد المتزايد على هذه الروبوتات كمصدر للدعم العاطفي. وتشير هذه النقاشات إلى وجود حوار أوسع حول مدى ملاءمة أن يتصرف النظام كمصدر للدعم دون أن يخلو النقد من التوجيه البنّاء.

شاركها.