תוכן עניינים
נקודה מרכזית
הריפו Claude-Mem הוא פלאגין לקלוד קוד שנותן לסוכני AI זיכרון מתמשך בין סשנים בלי להעמיס על חלון ההקשר. פותח על ידי thedotmack, הוא לוכד אוטומטית מה הסוכן עושה, דוחס את זה בצורה חכמה, ומזריק רק קונטקסט רלוונטי כשצריך - פותר את בעיית 'האמנזיה' שכולנו נתקלים בה בפרויקטים ארוכים.
מה זה Claude-Mem?
Claude-Mem הוא שכבת זיכרון מתוחכמת לקלוד קוד ששומרת על רציפות בין סשני קוד. הפרויקט claude-mem פותר את הבעיה של סוכני AI שמתחילים מחדש כל סשן, מאבדים את כל הקונטקסט מעבודה קודמת - אתגר שכולנו מתמודדים איתו כשבונים פרויקטים מורכבים עם סיוע AI לאורך ימים או שבועות.
מבחינה טכנית, זה פלאגין שלוכד תצפיות (שימוש בכלים, שינויי קבצים, החלטות), דוחס אותן באמצעות סיכום AI, ומשתמש באסטרטגיה של מה שנקרא 'progressive disclosure' כדי להזריק קונטקסט היסטורי רלוונטי בלי לשרוף את תקציב הטוקנים שלנו.
הבעיה שכולנו מכירים
הנה תרחיש שקורה לנו כל הזמן: אנחנו שלושה ימים לתוך בניית פיצ'ר עם קלוד קוד. הסוכן עזר לנו לעשות ריפקטור למערכת האוטנטיקציה ביום שני. ביום שלישי עברנו ענפים כדי לתקן באג קריטי. בוקר יום רביעי חוזרים לסיים את עבודת האוטנטיקציה - וקלוד מתנהג כאילו הוא רואה את בסיס הקוד שלנו בפעם הראשונה. כל הקונטקסט על ההחלטות הארכיטקטוניות שלנו, הדפוסים שהקמנו, המקרי קצה שדיברנו עליהם - נעלם.
מסתבר שהסיבה העיקרית היא לא האינטליגנציה של קלוד. זו המגבלה הבסיסית של חלונות הקשר. כל סשן מתחיל עם לוח נקי. בטח, אנחנו יכולים להדביק ידנית שיחות קודמות או קטעי קוד, אבל הגישה הזו לא עושה סקייל. אנחנו או שורפים אלפי טוקנים על היסטוריה (יקר ואיטי), או שאנחנו מאבדים רציפות (מתסכל ולא יעיל).
כלים קיימים מנסים גישות שונות - חלקם משתמשים בבסיסי נתונים וקטוריים כבדים שדורשים הקמת תשתית, אחרים מסתמכים על חיפוש מילות מפתח פשוט שמפספס קונטקסט עדין. היינו צריכים משהו שמאזן בין זיכרון ליעילות, משהו ש'פשוט עובד' בלי לדרוש מאיתנו להפוך למנהלי מסדי נתונים.
איך Claude-Mem עובד
Claude-Mem נוקט בגישה מרובדת לזיכרון סוכן - תחשבו על זה כמו שהזיכרון שלנו עובד, עם רמות שונות של פירוט.
בליבה, הפלאגין רץ לצד קלוד קוד ומתבונן בכל מה שהסוכן עושה. כשקלוד משתמש בכלי, משנה קובץ, או מקבל החלטה, Claude-Mem לוכד את זה כ'תצפית'. אבל הקטע המדליק הוא: במקום לשמור תמלילים גולמיים (שיהפכו מהר למסיביים), הוא משתמש ב-AI כדי לדחוס את התצפיות האלה לסיכומים צפופים וניתנים לחיפוש.
הדחיסה קורית בשכבות. עבודה אחרונה נשארת מפורטת. עבודה ישנה יותר מקבלת סיכום הדרגתי. זה משקף איך אנחנו זוכרים דברים באופן טבעי - אנחנו זוכרים את הפגישה של אתמול בפירוט, אבל את הפגישה מהחודש שעבר כסיכום ברמה גבוהה.
כשאנחנו מתחילים סשן חדש, Claude-Mem משתמש במה שהוא מכנה 'progressive disclosure'. קודם, הוא מזריק סקירת קונטקסט ברמה גבוהה - בעצם אומר לקלוד, "אתמול עשית ריפקטור למערכת האוטנטיקציה, בשבוע שעבר בנית את אינטגרציית התשלומים." אם קלוד צריך פרטים נוספים על משהו ספציפי, הוא יכול לבקש היסטוריה עמוקה יותר, ו-Claude-Mem מאחזר את התצפיות הדחוסות הרלוונטיות.
התחלה מהירה
ככה אנחנו מתחילים עם Claude-Mem:
# התקנת הפלאגין
git clone https://github.com/thedotmack/claude-mem.git
cd claude-mem
pip install -e .
# קונפיגורציה להתקנת קלוד קוד שלכם
cp config.example.json config.json
# ערכו את config.json עם ההעדפות שלכם
# התחילו להשתמש - זה רץ אוטומטית לצד קלוד קוד
code .
# Claude-Mem עכשיו לוכד ודוחס את הסשן שלכםדוגמה אמיתית
נגיד שאנחנו בונים אפליקציית ווב ועבדנו עם קלוד ביום שני כדי להקים את מודלי הדאטאבייס שלנו. ביום שלישי אנחנו מתחילים מחדש על שכבת ה-API. הנה מה קורה מאחורי הקלעים:
# מה ש-Claude-Mem לכד מיום שני (פשוט)
{
"session_id": "2026-02-03",
"observations": [
{
"type": "file_change",
"file": "models/user.py",
"summary": "יצרנו מודל User עם ולידציה של אימייל"
},
{
"type": "decision",
"context": "בחרנו SQLAlchemy על פני Django ORM לגמישות"
}
],
"compressed_summary": "בנינו מודלי דאטאבייס עם SQLAlchemy..."
}
# מה מוזרק בוקר יום שלישי
# ברמה גבוהה קודם:
"סשן קודם: הקמת מודלי דאטאבייס עם SQLAlchemy.
מודל User כולל ולידציה של אימייל."
# קונטקסט מפורט רק אם קלוד שואל:
if claude.asks_about("החלטות דאטאבייס"):
inject_detailed_history("בחרנו SQLAlchemy כי...")פיצ'רים מרכזיים
- לכידת תצפיות אוטומטית - כל שימוש בכלי, שינוי קובץ והחלטה נרשמים בלי שאנחנו צריכים לעשות כלום. זה כמו שיש לנו רושם פרוטוקול שקט בכל סשן.
- דחיסה מונעת AI - הקטע המדליק הוא שהוא משתמש ב-LLMs כדי לסכם היסטוריה בצורה חכמה, שומר מה שחשוב ומשליך רעש. תחשבו על זה כמו שאנחנו מסכמים באופן טבעי פגישה ארוכה לכמה נקודות מרכזיות.
- Progressive Disclosure - מתחיל עם קונטקסט ברמה גבוהה ושולף פרטים רק כשצריך, מנהל את תקציב הטוקנים שלנו בצורה חכמה. זה ההבדל בין קריאת תוכן עניינים של ספר לבין קריאת כל פרק.
- אינטגרציה עם חיפוש וקטורי - עובד עם Chroma לחיפוש סמנטי, כך שקלוד יכול למצוא קונטקסט רלוונטי מהעבר גם כשמילות המפתח לא תואמות בדיוק. אם קלוד עובד על 'אוטנטיקציה של משתמשים' הוא יכול למצוא עבודה קודמת על 'מערכת התחברות'.
- אחסון JSONL - שומר הכל בפורמט טקסט פשוט, תצפית אחת לכל שורה. קל לקרוא, קל לדבג, קל לשלוט בגרסאות. אין דאטאבייס לנהל.
- ממשק ווב לוקאלי - כולל ממשק דפדפן שבו אנחנו יכולים לראות בפועל מה הסוכן זוכר. שקיפות חשובה כשמדבגים למה קלוד קיבל החלטה מסוימת.
מתי להשתמש ב-Claude-Mem לעומת אלטרנטיבות
Claude-Mem מצטיין בפרויקטי פיתוח ארוכי טווח שבהם רציפות חשובה - בניית אפליקציות מורכבות לאורך ימים או שבועות, תחזוקה של בסיסי קוד שבהם צריך לזכור החלטות ארכיטקטוניות, עבודה על פני מספר ענפי Git שבהם החלפת קונטקסט היא תכופה.
כלים אחרים בתחום הזה נוקטים בגישות שונות. חלקם משתמשים במערכות RAG (Retrieval Augmented Generation) עם דרישות תשתית כבדות - חזקות אבל מורכבות להקים. אחרים מסתמכים על הזרקת קונטקסט פשוטה מבוססת קבצים - קלילה אבל לא חכמה לגבי מה להזריק. Claude-Mem יושב בנקודה מתוקה: מספיק חכם כדי להיות שימושי, מספיק פשוט כדי בעצם לדפלוי.
למשימות מהירות של סשן אחד, Claude-Mem עשוי להיות יתר על המידה - ההקשר הנייטיב של קלוד קוד בסדר. אבל ברגע שאנחנו ביום שני של פרויקט, קבלת זיכרון מתמשך הופכת לחיונית. בעיניי, זו תשתית שבסופו של דבר צריכה להיות מובנית בקלוד קוד עצמו, אבל עד אז, Claude-Mem ממלא פער קריטי.
בעיניי - האם אשתמש בזה?
לעניות דעתי, זה מטפל בכאב אמיתי שהופך תכנות זוגי ארוך טווח עם AI למתסכל. בעיית 'האמנזיה' היא לא רק מעצבנת - היא מגבילה באופן אקטיבי מה אנחנו יכולים לבנות עם סוכני AI. בכל פעם שאנחנו מאתחלים סשן וצריכים להסביר מחדש קונטקסט, אנחנו משלמים מס בזמן ובטוקנים.
הגישה של progressive disclosure היא חכמה במיוחד. היא פותרת את המתח הבסיסי בין 'לזכור הכל' (יקר) ל'לא לזכור כלום' (חסר תועלת) על ידי היותה סלקטיבית לגבי רמות פירוט. זה בדיוק סוג ההנדסה המעשית שאנחנו צריכים בכלי AI.
המגבלה שצריך לשים לב אליה: איכות הדחיסה תלויה לחלוטין באיזה LLM אנחנו משתמשים לסיכום. מודל סיכום חלש יאבד ניואנסים חשובים. הכלי גם דורש קצת כיוונון - כמה קונטקסט להזריק, עד כמה להיות אגרסיבי עם הדחיסה, מתי לשלוף היסטוריה עמוקה. זה עדיין לא ממש 'הגדר ושכח'.
לעבודה שלנו ב-YUV.AI, שבה אנחנו כל הזמן בונים ועושים איטרציות על פרויקטי סוכני AI על פני ענפים וסשנים מרובים, זה בדיוק מה שאנחנו צריכים. אחסון ה-JSONL אומר שאנחנו יכולים לשלוט בגרסאות של הזיכרון של הסוכן לצד הקוד שלנו, מה שפותח אפשרויות מעניינות לשיתוף פעולה צוותי.
תבדקו את הריפו: claude-mem ב-GitHub
שאלות נפוצות
מה זה Claude-Mem?
Claude-Mem הוא פלאגין לקלוד קוד שמספק זיכרון מתמשך בין סשנים על ידי לכידת תצפיות של הסוכן, דחיסה שלהן בצורה חכמה, והזרקת קונטקסט רלוונטי כשצריך.
מי יצר את Claude-Mem?
את Claude-Mem יצר thedotmack, מפתח שמתמקד בשיפור זרימות עבודה של סוכני AI וניהול הקשר.
מתי כדאי להשתמש ב-Claude-Mem?
כדאי להשתמש ב-Claude-Mem כשעובדים על פרויקטים שמשתרעים על פני סשנים מרובים, במיוחד כשעוברים בין ענפי Git או כשהחלטות ארכיטקטוניות מסשנים קודמים צריכות להישמר.
מה האלטרנטיבות ל-Claude-Mem?
האלטרנטיבות כוללות מערכות RAG מלאות עם בסיסי נתונים וקטוריים (יותר חזקות אבל מורכבות להקים), הזרקת קונטקסט פשוטה מבוססת קבצים (קלילה אבל לא חכמה), או ניהול ידני של קונטקסט על ידי העתקת שיחות קודמות (גוזל זמן ולא עושה סקייל).
מה המגבלות של Claude-Mem?
המגבלות העיקריות הן שאיכות הדחיסה תלויה ב-LLM המשמש לסיכום, הוא דורש כיוונון כדי למצוא את האיזון הנכון של קונטקסט מוזרק, והוא עדיין תוכנה בשלבים מוקדמים שעשויה לדרוש התאמות קונפיגורציה לזרימות עבודה שונות.
