1

סוכני AI אוטונומיים ב-IDEs: עתיד הקודינג

סוכני AI אוטונומיים ב-IDEs מאת Tech News Editor הם מערכות שמבינות בסיסי קוד שלמים ופותרות באגים ארכיטקטוניים באופן עצמאי, מעבר להשלמה אוטומטית. הם משתמשים בחלונות קונטקסט אינסופיים ולולאות חשיבה כדי לרפקטר קוד על פני קבצים מרובים בזמן שאנחנו עובדים....

מאת Yuval Avidani
סוכני AI אוטונומיים ב-IDEs: עתיד הקודינג
2

Q-Star v3: סוכן AI שמתקן את עצמו ומבטל הזיות בקוד

הריפו Q-Star v3 מאת Elena Rostova הוא סוכן AI לכתיבת קוד שמתקן את עצמו ומבטל הזיות בייצור קוד מורכב באמצעות ארכיטקטורה neural-symbolic עם בדיקת AST בזמן אמת. הוא מחבר LLM עם solver לוגי דטרמיניסטי כדי להבטיח נכונות לפני הפקת קוד....

מאת Yuval Avidani
Q-Star v3: סוכן AI שמתקן את עצמו ומבטל הזיות בקוד
3

SWE-agent 2.0: הנדסת תוכנה אוטונומית עם AI בקוד פתוח

הריפו SWE-agent 2.0 מאת Princeton NLP Group הוא מערכת AI אוטונומית בקוד פתוח שהופכת מודלי שפה לסוכני תוכנה המסוגלים לפתור באגים אמיתיים ב-GitHub. הוא פותר את בעיית אובדן הקונטקסט במשימות קידוד ארוכות דרך ממשק Agent-Computer Interface המותאם למודלי שפה....

מאת Yuval Avidani
SWE-agent 2.0: הנדסת תוכנה אוטונומית עם AI בקוד פתוח

מאמרים אחרונים

הריפו ChatDev 2.0 'DevAll' מאת OpenBMB הוא פלטפורמת אורקסטרציה של סוכני AI ללא קוד שהופכת מבנים נוקשים של חברות תוכנה וירטואליות למערכות תהליך עבודה גמישות לכל תחום. הפלטפורמה מאפשרת לנו לעצב שיתופי פעולה מותאמים אישית של סוכנים באמצעות ממשק ויזואלי או Python SDK....

הפרויקט Superpowers מאלץ סוכני קוד של AI לעבוד לפי פרקטיקות של מפתחים בכירים כמו TDD ותכנון שיטתי. במקום לתת לסוכנים למהר לכתוב קוד, הוא אוכף תהליך עבודה משמעתי: לכתוב טסטים קודם, לתכנן לפני להטמיע, ולבדוק לפני לשחרר....

מסתבר שהריפו Beads פותר את בעיית הזיכרון המתמשך ב-AI agents על ידי שמירת גרפים של משימות כקבצי JSONL עם ווירסניינג ישירות ב-Git - כך ההקשר של ה-agent שורד מעברים בין בראנצ'ים ומרג'ים....

מסתבר שהמאמר MoEBlaze פותר את צוואר הבקבוק הקריטי של הזיכרון באימון Mixture-of-Experts שמגביל את גדלי הבאצ'ים ומהירות האימון שלנו. דרך שליחת טוקנים ללא באפר וקרנלים מותאמים, הוא משיג האצה של פי 4 והפחתת זיכרון של 50% לעומת פריימוורקים קיימים....

מסתבר שהפרויקט UI-TARS-desktop של ByteDance מגשר בין החשיבה של AI לביצוע אמיתי על ידי מתן הבנה ויזואלית לסוכנים. במקום להיות מוגבלים ל-APIs, הוא רואה את המסך שלנו ושולט בעכבר ובמקלדת כמו שאנחנו עושים - סוף סוף הופך AI לשימושי למשימות יומיומיות אמיתיות....

מסתבר שיוזמות פאזינג רצוף כמו OSS-Fuzz מחמיצות פגיעויות קריטיות אפילו אחרי שנים של בדיקות. המחקר הזה חושף למה כיסוי קצוות סטנדרטי לא מספיק ומציג תהליך עבודה בחמישה שלבים עם טכניקות Context-Sensitive ו-Value Coverage למציאת הבאגים ששורדים....