ChatDev 2.0: מחברה וירטואלית לפלטפורמת מולטי-אג'נט ללא קוד

מאת Yuval Avidani

הריפו ChatDev 2.0 'DevAll' מאת OpenBMB הוא פלטפורמת אורקסטרציה של סוכני AI ללא קוד שהופכת מבנים נוקשים של חברות תוכנה וירטואליות למערכות תהליך עבודה גמישות לכל תחום. הפלטפורמה מאפשרת לנו לעצב שיתופי פעולה מותאמים אישית של סוכנים באמצעות ממשק ויזואלי או Python SDK....

לעצור סוכני AI מלכתוב ספגטי: אכיפת TDD עם Superpowers

מאת Yuval Avidani

הפרויקט Superpowers מאלץ סוכני קוד של AI לעבוד לפי פרקטיקות של מפתחים בכירים כמו TDD ותכנון שיטתי. במקום לתת לסוכנים למהר לכתוב קוד, הוא אוכף תהליך עבודה משמעתי: לכתוב טסטים קודם, לתכנן לפני להטמיע, ולבדוק לפני לשחרר....

Beads: זיכרון מבוסס-Git לאייג'נטים שבאמת זוכרים

מאת Yuval Avidani

מסתבר שהריפו Beads פותר את בעיית הזיכרון המתמשך ב-AI agents על ידי שמירת גרפים של משימות כקבצי JSONL עם ווירסניינג ישירות ב-Git - כך ההקשר של ה-agent שורד מעברים בין בראנצ'ים ומרג'ים....

שבירת חומת הזיכרון: איך MoEBlaze משיג אימון MoE מהיר פי 4

מאת Yuval Avidani

מסתבר שהמאמר MoEBlaze פותר את צוואר הבקבוק הקריטי של הזיכרון באימון Mixture-of-Experts שמגביל את גדלי הבאצ'ים ומהירות האימון שלנו. דרך שליחת טוקנים ללא באפר וקרנלים מותאמים, הוא משיג האצה של פי 4 והפחתת זיכרון של 50% לעומת פריימוורקים קיימים....

UI-TARS-desktop: ה-AI Agent שממש רואה ושולט במחשבים שלנו

מאת Yuval Avidani

מסתבר שהפרויקט UI-TARS-desktop של ByteDance מגשר בין החשיבה של AI לביצוע אמיתי על ידי מתן הבנה ויזואלית לסוכנים. במקום להיות מוגבלים ל-APIs, הוא רואה את המסך שלנו ושולט בעכבר ובמקלדת כמו שאנחנו עושים - סוף סוף הופך AI לשימושי למשימות יומיומיות אמיתיות....

למה פאזינג רצוף לא מספיק: הבאגים ששורדים

מאת Yuval Avidani

מסתבר שיוזמות פאזינג רצוף כמו OSS-Fuzz מחמיצות פגיעויות קריטיות אפילו אחרי שנים של בדיקות. המחקר הזה חושף למה כיסוי קצוות סטנדרטי לא מספיק ומציג תהליך עבודה בחמישה שלבים עם טכניקות Context-Sensitive ו-Value Coverage למציאת הבאגים ששורדים....