Post by Al-Mothafar Al-Hasan

Principal Software Engineer | Full-Stack | Java | JavaScript/TypeScript

استخدمت Claude Opus 4.8.. الحقيقة نقلة نوعية بفارق مخيف! انسونا من التقييمات الجاهزة على الانترنت، التجربة افضل وغالبا تخالف ما تتكلم عنه تلك ال Benchmarks، بالطبع انا استخدمت Opus 4.7 وكان Sonnet 4.6 افضل منه بشكل عام، معظم استخدامي كان Sonnet 4.6 و Opus 4.6 بس مع الـ Opus 4.8 الامور تغيرت، بطريقة ممتازة ومخيفة جدا ايضا! مبدئيا، النموذج ما ببدأ يشتغل على العمياني مثل ما يقال، لا، فعلا بجيب المتطلبات بشكل دقيق وبعمل Reasoning محترم ودقيق، بناقشك، لو انت خطأ بوضح لك شو الخطأ، وما بحصر تفكيره فقط باللي بتطلبه، بل مرات بقترح عليك اشياء غايبة عن بالك. باختصار: فعلا بفكر، واذا فيه مشاكل بينت معه بسأل. نسبة "الهبد" قليلة بشكل واضح، والشغل انظف. بس اللي صار معي اليوم خصوصا مش عارف كيف اوصفه! رهيب، وأعجبني، بس مضحك ومخيف بنفس الوقت! طبعا انا بكون مجهز تعليمات محددة ومفصلة بكل مشروع بشتغل فيه، ومنه انه بطلب من الـ Copilot مثلا او Claude Code انه يخزن الدروس اللي بتعلمها من الاخطاء اول باول، وهذا شيء مفيد. لكن اليوم الامر انتقل لشيء خارج هذا المألوف. اللي صار معي انه بدأ النموذج يقلدني ويتعلم مني وليس فقط التعلم من الأخطاء! فيه شيء بعمله لما افتح PR اني بعمل Self Review؛ المحترم شاف اني بعمل هيك، وبدون ما اطلب منه صار يعمل مثلي! لقيته معلق وعامل Self Review على وحدة من الـ PRs لما شافني بعمل هيك! والقصد من الـ Self Review اني بفتح نفس الـ PR وبكتب تعليقاتي على شيء خطأ شفته بالكود تبعي او افكار او توضيحات ليش عملت هيك وليش ما عملت هيك. المهم الAgent صار زي كأنه موظف عندك تحت ادارتك حاب يتعلم منك وبحاول يستفيد من طريقتك! بس الفرق.. هذا ذكاء صناعي! وصراحة - مؤلمة ايضا - هو أفضل من كثير من الجينيور، للأسف.