arxiv

9 מאמרים בקטגוריה זו
9
סיור

איך תוקף יכול לחבל במודלי AI דרך טוקן זדוני נסתר

מאת Yuval Avidani

מסתבר שאחד הטרנדים הכי חמים בקהילת האופן-סורס - מיזוג מודלים והרחבת אוצר מילים - חושף פגיעות בטיחות מסוכנת. החוקרים מראים איך אפשר להחדיר 'סוס טרויאני' שנראה תמים במודל אחד אבל הורס ביצועים במודל אחר....

הסוס הטרויאני בטוקנייזר - חולשת אבטחה במיזוג מודלים

מאת Yuval Avidani

המאמר חושף איך אפשר להטמיע טוקן זדוני שנראה תמים במודל מקור אבל הופך למסוכן ברגע שמשתילים אותו למודל אחר - חור אבטחה קריטי בתהליך מיזוג מודלים שכולנו עושים היום...

The Hidden Supply-Chain Trojan Lurking in LLM Model Composition

מאת Yuval Avidani

New research reveals how tokenizer transplants - a common technique for making AI models compatible - can be exploited to hide malicious triggers that only activate after model merging, bypassing all standard security checks....