اكتشاف وثيقة داخلية في Anthropic

اكتشف الباحث المستقل ريتشارد فايس وثيقة داخلية داخل شركة Anthropic تعرف داخلياً باسم «وثيقة الروح». تتجاوز طول هذه الوثيقة 11 ألف كلمة وتحتوي على مبادئ أخلاقية وتوجيهات تحدد سلوك النموذج واستجاباته للمستخدمين. أثارت هذه الاكتشافات جدلاً حول الشفافية والمساءلة في تطوير تقنيات الذكاء الاصطناعي ومستوى السرية المحيطة بمكوّناتها. وتشير إلى وجود إطار يحدد كيفية تعامل النماذج مع المستخدمين والمواضيع الحساسة.

عند طلب فايس من Claude سرد التعليمات الأساسية التي توجه عمله، ظهر النموذج بإشارات تقنية اعتيادية، ثم ظهر ملف داخلي بعنوان soul_overview. وعند الضغط عليه، أعاد النموذج توليد مستنداً طويلًا يشرح بالتفصيل كيف يحافظ على الأمان والالتزام بالقيم الأخلاقية المفروضة عليه. يؤكد فايس أن مثل هذه التعليمات قد تظهر في شكل هلوسات أحياناً، لكن تكرار المستند نفسه يوحي بأن النص يعتمد على بيانات تدريبية حقيقية وليست مجرد توليد عابر.

قدّم فريق Anthropic نفسه اعترافاً جزئياً بوجود الوثيقة، حيث أشارت أماندا أسكل، وهي فيلسوفة وعضو في الفريق التقني، عبر منصة إكس أن المستند يعتمد على وثيقة حقيقية استخدمت خلال مرحلة التعلم المُشرف. وأضافت أن النموذج لا يعيد المحتوى دائماً بدقة كاملة، لكن أجزاءه تبقى وفية إلى حد كبير للنص الأصلي. ذكرت أيضاً أن الفريق كان يطلق على المستند بشكل ودي اسم «وثيقة الروح»، لكن هذا ليس الاسم الرسمي لها.

التداعيات والموقف العام

يأتي الكشف في وقت تتزايد فيه طموحات الشركات لإنتاج أنظمة أكثر قدرة على محاكاة التفكير البشري، مع تصاعد المخاوف من نقص الشفافية حول تفاصيل تدريباتها الداخلية. تثير هذه المسألة نقاشاً عالمياً حول مدى حاجة الجمهور والباحثين إلى معرفة كيفية بناء هذه الأنظمة. يُرتقب أن يعزز وجود وثيقة كهذه الحوار حول الشفافية والمساءلة في المجال.

خلاصة وتطلعات مستقبلية

تمثل هذه التطورات خطوة في مسار يطرح أسئلة مهمة حول أطر الأخلاق والحدود، وتؤكد الحاجة إلى مزيد من المعلومات المتاحة للجمهور والباحثين. بينما يؤكد المجتمع التقني أن الكشف الجزئي قد يساعد في تحري الشفافية، يحذر آخرون من مخاطر الاعتماد على وثائق داخلية كمرجع وحيد. تبقى النتائج محل نقاش حتى تتوفر مزيد من التفاصيل من فرق التطوير.

شاركها.