Post by Udi Menkes

AI Product Leader | Building Financial Language Models & AI Native Innovative Products at Intuit

פרק אחרון - היום האחרון, והפעם גם אני על במת AIE היום עליתי להרצות בעצמי. אבל קודם - הדברים הכי חזקים ששמעתי. ▪️ Barr Yaron - סקר ה-AI Engineering 94% בונים מודלים סגורים, רבים גם על פתוחים במקביל - אופן סורס מרחיב, לא מחליף. האתגר מספר אחת הוא eval, ו-״vibe review״ עדיין הדרך הכי נפוצה לבדוק. הלקח: כולם בונים, מעטים יודעים למדוד. מי שיפתור eval יחזיק יתרון. ▪️ מייסדי DSPy כל משימת AI שחוזרת על עצמה צריכה ממשק input/output מוגדר. הלקח: מפסיקים לכתוב פרומפטים, מתחילים להגדיר חוזים - והמערכת הופכת לתחזוקתית. ▪️ Anthropic - Mike Krieger (מייסד אינסטגרם, כיום CPO) להיות בלתי-סביר ולשחרר את המודל. לנהל כוונות ו-tradeoffs דרך ארטיפקטים. כל שבועיים - למדוד דופק פרוייקטים ולהחליט אם ממשיכים או pivot. ו-״Project Unship״: מה כדאי להוריד. הלקח: הבשלות היא לא רק להוסיף - היא לדעת מה למחוק. ▪️ Stripe - מסחר אייג׳נטי פרוטוקול UCP למסחר בין סוכנים. הלקח: כשסוכנים יקנו וימכרו זה לזה, צריך שכבת תשלומים מובנית. Stripe שם. ▪️ מייסד Exa GTM כבעיה הנדסית. הוא שכפל את עצמו - אימיילים והחלטות מהעבר - לסוכן שמדבר במקומו. הלקח: מכירות ושיווק הופכים מ״אמנות״ למערכת שאפשר להנדס. ▪️ Nubank - Simulation Maxxing מייצרים דאטת eval בסימולציה במקום להמתין לפרודקשן - ומשחררים פי 20 מהר יותר. כל שינוי עובר de-risking לפני שנוגע בלקוח אמיתי. הלקח: תיקון שהיה מוריד שביעות רצון פשוט לא הגיע לפרודקשן. זה עתיד ה-eval. ▪️ Vercel - סוכני Eve Framework חדש. מול Claude Code: פחות צעדים, יותר הצלחה נייטיבית, פחות כתובות ״הזויות״. הלקח: תחרות ה-frameworks רק מתחילה, וההבדלים כבר נמדדים במספרים. ▪️ Theo - מתכנת שהפך ליוטיובר מצליח על מה זה ללכת בגדול יותר - ומה כבר גדול מדי - עם מודלים כמו Fable. צריך להתגבר על עצמנו וללכת גדול יותר ממה שנראה הגיוני. הלקח: רוב הקבוצות חושבות בקטן מדי. החלון להיות שאפתני פתוח עכשיו. ▪️ Y Combinator - Garry Tan את זה שמרתי לסוף, כי אני מעריץ. הבאץ׳ האחרון כולו בונה חברות AI native מהיסוד - עם ה-revenue per employee הגבוה בהיסטוריה של YC. צוותים קטנים, ערך עצום. ודיבר על זיכרון: כל ארגון צריך ״ויקי חכם״ שמתעדכן בכל אינטראקציה. מה ששווה לאחזר - זה המוצר. תמיד ״skillify״ אחרי שאתה מרוצה. אם צריך לבקש פעמיים - נכשלת. המימוש שלו: gbrain. הלקח: בדיוק מה שאני מדבר עליו ומטמיע כבר תקופה. הזיכרון שמשתפר בכל אינטראקציה הוא הקרב האמיתי - לא המודל. ואז - הגיע התור שלי. שבועות של הכנה מתקפלים ל-20 דקות בוערות שחולפות בטיל. נשארתי לענות על שאלות בחוץ עוד כמעט שעה - אז אני מניח שזה היה די טוב. המסקנה שלי מהכנס: אנחנו נכנסים לעידן חדש. צריך להתנתק מהניסיון לחקות עבודת בני אדם - רק טובה או מהירה יותר - ולצאת מגבולות החשיבה שהכרנו כי המודלים החדשים כבר שם. צוות קטן שמייצר פי 400 ערך הוא הבייסליין החדש. ועם מודלים כמו Fable צריך ללמוד מחדש איך מגדירים ״טעם״, איך מכללים את הבנת המודלים אותנו, ואיך מבצעים דברים גדולים בהרבה ממה שחשבנו שאפשרי. ללא ספק הכנס הכי טוב שהייתי בו בחיים, בפער. אשתף ברגע שהסשן יעלה ליוטיוב. מחר פרק בונוס. Stay tuned - follow Udi Menkes