FlashMLA: קרנלי CUDA של DeepSeek להאצת Inference של LLMs

מאת Yuval Avidani

הריפו FlashMLA מאת DeepSeek הוא ספריית קרנלים ב-CUDA שמייעלת Multi-head Latent Attention (MLA) עבור inference של LLMs בפרודקשן. הוא מאפשר האצה משמעותית דרך FP8 KV caching וקרנלים מיוחדים ל-GPUs מדור Hopper/Blackwell....

Moltbot: עוזר AI לוקאלי לכל ערוץ מסרים

מאת Yuval Avidani

הריפו Moltbot מאת moltbot הוא פלטפורמת עוזר AI אישי שרץ לגמרי על המכשירים שלנו תוך התחברות לכל ערוץ המסרים המרכזי שאנחנו כבר משתמשים בו. הוא נותן לנו סיוע AI בכל מקום בלי לוותר על פרטיות ושליטה במידע....

למידת חיזוק קוונטית משיגה ביצועים של RL קלאסי עם פי 100 פחות פרמטרים

מאת Yuval Avidani

לפי המאמר "Quantum RL vs. Classical Deep RL" מאת Vincent Gurgul, Ying Chen ו-Stefan Lessmann, סוכני למידת חיזוק קוונטיים עם מעגלים קוונטיים משיגים ביצועים דומים למודלים קלאסיים מתקדמים כמו DDPG ו-DQN - אבל עם פחות פרמטרים בסדרי גודל. זה מייצג שינוי פרדיגמה אפשרי ב-AI יעיל לאפליקציות פיננסיות....

Remotion: יצירת סרטונים בצורה פרוגרמטית עם React

מאת Yuval Avidani

הריפו Remotion מאת Jonny Burger הוא פריימוורק שמאפשר למפתחים ליצור סרטונים בצורה פרוגרמטית באמצעות קומפוננטות React. הוא משנה את ייצור הוידאו על ידי הבאת הפרדיגמה של React ליצירת סרטונים - כותבים JSX ו-CSS, מקבלים קבצי MP4....

PageIndex: RAG ללא ווקטורים עם החזרת מסמכים מבוססת חשיבה

מאת Yuval Avidani

הריפו PageIndex מאת Vectify AI הוא פריימוורק קוד פתוח ל-RAG שמבטל Embeddings ווקטוריים וחלוקה לחלקים, ומחליף אותם בעצי מסמכים היררכיים להחזרת מידע מבוססת חשיבה. משיג 98.7% דיוק במשימות ניתוח מסמכים מקצועיים....

GitHub Trending: גלו מה מפתחים בונים עכשיו

מאת Yuval Avidani

הפיד GitHub Trending הוא רשימה שמתעדכנת יומית של ריפוזיטוריז שצוברים כוכבים הכי מהר ב-GitHub, ועוזר לנו לגלות את הפרויקטים המרגשים ביותר שקהילת הקוד הפתוח בונה ברגע זה....