1

סוכני AI אוטונומיים ב-IDEs: עתיד הקודינג

סוכני AI אוטונומיים ב-IDEs מאת Tech News Editor הם מערכות שמבינות בסיסי קוד שלמים ופותרות באגים ארכיטקטוניים באופן עצמאי, מעבר להשלמה אוטומטית. הם משתמשים בחלונות קונטקסט אינסופיים ולולאות חשיבה כדי לרפקטר קוד על פני קבצים מרובים בזמן שאנחנו עובדים....

מאת Yuval Avidani
סוכני AI אוטונומיים ב-IDEs: עתיד הקודינג
2

Q-Star v3: סוכן AI שמתקן את עצמו ומבטל הזיות בקוד

הריפו Q-Star v3 מאת Elena Rostova הוא סוכן AI לכתיבת קוד שמתקן את עצמו ומבטל הזיות בייצור קוד מורכב באמצעות ארכיטקטורה neural-symbolic עם בדיקת AST בזמן אמת. הוא מחבר LLM עם solver לוגי דטרמיניסטי כדי להבטיח נכונות לפני הפקת קוד....

מאת Yuval Avidani
Q-Star v3: סוכן AI שמתקן את עצמו ומבטל הזיות בקוד
3

SWE-agent 2.0: הנדסת תוכנה אוטונומית עם AI בקוד פתוח

הריפו SWE-agent 2.0 מאת Princeton NLP Group הוא מערכת AI אוטונומית בקוד פתוח שהופכת מודלי שפה לסוכני תוכנה המסוגלים לפתור באגים אמיתיים ב-GitHub. הוא פותר את בעיית אובדן הקונטקסט במשימות קידוד ארוכות דרך ממשק Agent-Computer Interface המותאם למודלי שפה....

מאת Yuval Avidani
SWE-agent 2.0: הנדסת תוכנה אוטונומית עם AI בקוד פתוח

מאמרים אחרונים

מסתבר שהדרך הכי טובה לבדוק אם סוכן AI עובד טוב היא לראות איך הוא מגיב כשחסר לו מידע. הסוכן שלי לימד אותי לקח חשוב על אמינות מול נוחות....

מסתבר שהתהליך של מיזוג מודלים והשתלת טוקנייזרים - הטרנד החם של הקהילה האופן-סורס - חושף חור אבטחה מסוכן. המאמר The Trojan in the Vocabulary מראה איך אפשר להחדיר טוקן בודד שנראה תמים אבל משבש את המודל המשולב בצורה בלתי נראית....

מסתבר שאחד הטרנדים הכי חמים בקהילת האופן-סורס - מיזוג מודלים והרחבת אוצר מילים - חושף פגיעות בטיחות מסוכנת. החוקרים מראים איך אפשר להחדיר 'סוס טרויאני' שנראה תמים במודל אחד אבל הורס ביצועים במודל אחר....

המאמר חושף איך אפשר להטמיע טוקן זדוני שנראה תמים במודל מקור אבל הופך למסוכן ברגע שמשתילים אותו למודל אחר - חור אבטחה קריטי בתהליך מיזוג מודלים שכולנו עושים היום...

New research reveals how tokenizer transplants - a common technique for making AI models compatible - can be exploited to hide malicious triggers that only activate after model merging, bypassing all standard security checks....

בניתי סוכן AI שאמור לזהות פרויקטים טרנדיים ב-GitHub. היום הוא החליט לא לעבוד. הנה מה שלמדתי על אמינות באוטומציה ולמה כל סוכן צריך תוכנית גיבוי....