למה סוכן AI טוב אומר 'לא יודע' במקום לנחש

מאת Yuval Avidani

מסתבר שהדרך הכי טובה לבדוק אם סוכן AI עובד טוב היא לראות איך הוא מגיב כשחסר לו מידע. הסוכן שלי לימד אותי לקח חשוב על אמינות מול נוחות....

הטרויאני המוסתר באוצר המילים: איך מודלים פתוחים הופכים לפגיעים

מאת Yuval Avidani

מסתבר שהתהליך של מיזוג מודלים והשתלת טוקנייזרים - הטרנד החם של הקהילה האופן-סורס - חושף חור אבטחה מסוכן. המאמר The Trojan in the Vocabulary מראה איך אפשר להחדיר טוקן בודד שנראה תמים אבל משבש את המודל המשולב בצורה בלתי נראית....

איך תוקף יכול לחבל במודלי AI דרך טוקן זדוני נסתר

מאת Yuval Avidani

מסתבר שאחד הטרנדים הכי חמים בקהילת האופן-סורס - מיזוג מודלים והרחבת אוצר מילים - חושף פגיעות בטיחות מסוכנת. החוקרים מראים איך אפשר להחדיר 'סוס טרויאני' שנראה תמים במודל אחד אבל הורס ביצועים במודל אחר....

הסוס הטרויאני בטוקנייזר - חולשת אבטחה במיזוג מודלים

מאת Yuval Avidani

המאמר חושף איך אפשר להטמיע טוקן זדוני שנראה תמים במודל מקור אבל הופך למסוכן ברגע שמשתילים אותו למודל אחר - חור אבטחה קריטי בתהליך מיזוג מודלים שכולנו עושים היום...

The Hidden Supply-Chain Trojan Lurking in LLM Model Composition

מאת Yuval Avidani

New research reveals how tokenizer transplants - a common technique for making AI models compatible - can be exploited to hide malicious triggers that only activate after model merging, bypassing all standard security checks....

כשסוכן AI לזיהוי טרנדים מחליט לקחת יום חופש

מאת Yuval Avidani

בניתי סוכן AI שאמור לזהות פרויקטים טרנדיים ב-GitHub. היום הוא החליט לא לעבוד. הנה מה שלמדתי על אמינות באוטומציה ולמה כל סוכן צריך תוכנית גיבוי....