פיתחתי סטודיו AI שמסוגל לייצר דמויות עקביות באיכות גבוהה - בואו לראות את התוצרים!

מאת Yuval Avidani
זמן קריאה: 2 דק'

תוכן עניינים

הסוד נמצא בפרטים.

פיתחתי סטודיו AI ליצירת דמויות עקביות ובו אני משתמש דרך Fal בכל מיני סוגים של API כדי לחבר הכל ביחד. משתמש בוחר תמונה, כדי לזהות את הלבוש במדויק אני משתמש ב-API של Flux Kontext. אח״כ אני מבצע קריאת API ל-Ideogram Edit כדי לדאוג שהפנים והגוף יקבלו את אותו דיוק מהתמונה המקורית. חיבור של שני מודלים בקלות יתירה דרך Fal תוך שימוש בקלוד קוד לפיתוח.

ל-Fal אפילו יש הנחיות ל-LLM עבור כל API מה שהופך הכל לקל יותר. זה סטנדרט שהתעשייה מאמצת שנקרא llm.txt, כל שירות API יתחיל ליישם קובץ כזה בשירות שלו שמסביר ל-LLMs איך להתחבר אליו בקלות. זה הכרחי. אבל, במה שעשיתי אין חידוש גדול. כל אחד יכול. הסוד נמצא לא בזה שחיברתי 2 מודלים. הסוד נעוץ במה שעשיתי בין לבין ותוך כדי. מלבד שני המודלים האלה, הוספתי עוד מספר שכבות כדי להגיע לדיוק מקסימלי.

הצצה לגלריה בסטודיו שלי

השכבות האלה פועלות באמצעות AI Agent שאחראי לקבל את הפרומפט ולוודא דרך כמה טכניקות שונות שהתוצר יתאים למה שביקשנו. גם בתווי הפנים וגם בפריטי הלבוש. לא רק זה. אלא יכולת לג׳נרט מספר דמויות בתמונה אחת, מפרומפט בודד, וכל זה בלי לאמן מודל. כל מה שצריך לעשות זה להעלות תמונת רפרנס אחת בלבד, וגם מקבלים דיוק מקסימלי, אבל גם אפשר לשלב כמה דמויות שרוצים בתמונה, וסוכן ה-AI המתקדם שלי דואג לבצע את כל הקסם ואת כל התזמורת עם כל המודלים והטכניקות שהגדרתי עם קלוד קוד מתחת למכסה המנוע.

מסך ג'ינרוט התמונות עם האפשרויות השונות

שני המודלים שחיברתי הם אחלה והם לגמרי עושים את העבודה מצוין מתמונת רפרנס אחת. אבל זה לא מספיק וגם לא מחדש. בעיניי, היצירתיות מסתתרת בדרכים שאינן השביל הראשי. היות וזה מוצר שאני אעלה לאוויר, אני לא מפרסם את הפרטים ככה בריש גלי של מה שקורה בין לבין, אבל כן אגיד שזה לא רק שימוש ב-2 מודלים, אלא שילוב של לפחות עוד 4 תהליכים שונים ובניית תשתית אג׳נטית שמבטיחה תוצאות טובות יותר.

יש פה AI Agent מתקדם שאחראי על הכל והוא קבלן הביצוע. גם אם כולם בונים עם מלט ובטון וחצץ וחול (המודלים בדוגמא שלנו), הוא אחראי על הארכיטקטורה של הכל ועל ביצוע בפועל. אם יש לכם תמונות רפרנס שתרצו שאריץ סטודיו שלי אתם מוזמנים להדביק בתגובות עם פרומפט ואני אשתדל להעלות לסטודיו ולהדביק לכם חזרה את התוצאות כדי שתוכלו להתרשם. עד שאפתח למשתמשים.

רוצים כמה דוגמאות? קבלו:

לקחתי את התמונה הזו של הרבי:

תמונת הרפרנס המקורית של הרבי מתפלל ב-770

והסטודיו שלי יצר את זה:

הרבי מליובאוויטש ברחובות ניו יורק, הלבוש שלו מדויק 99% (מלבד הרצועה בצד ימין, והידיים המשולבות)

דוגמא נוספת, תמונת המקור היא:

תמונת המקור מהסרט חגיגה בסנוקר, זאב רווח משחק את "חכם חנוכה"

והסטודיו שלי יצר את זה:

זאב רווח משחק את "חכם חנוכה"

דוגמא נוספת ליצירה על בסיס תמונת רפרנס בסטודיו:

ולהבדיל, יש בסטודיו אפילו מודל לבובו שאימנתי שיכול לייצר כאלה דברים יפים:

שופינג בפריז
דונאלד טראמפ על רקע הבית הלבן
אילון מאסק עם חולצת טסלה
אד שירן בהופעה
וולברין שותה בירה בשוויץ
הג'וקר בלונדון
הארלי קווין בלונדון
הארי פוטר בלונדון
לבובו משפחת סימפסון
וולברין בלונדון
הדוב פדינגטון
ספיידרמן
סופרמן
באטמן
איירון מן
המלכה אליזבת'
הקמע של סטארבקס

יאללה תאתגרו את הסוכן ואני מזכיר שמחיר ההשקה של הקורס שלי (וייב קודינג עם קלוד קוד) יהיה זמין רק עד סוף אוגוסט, ממליץ לנצל ולהצטרף לכל מי שכבר עלה על הרכבת, כל הפרטים באקדמיה שלי:

האקדמיה לבינה מלאכותית של יובל אבידני - YUV.AI Academy

ומה חשבתם? אשמח לקרוא!

שבת שלום ובשורות טובות בתפילה להשבת חטופינו בריאים ושלמים בגוף ובנפש בקרוב ממש, ולהחזרת כוחות הביטחון בשלום הביתה!!!

יובל

תוייג ב

studio, AI, labubu, ideogram, fal, kontext, flux

עדכון אחרון אוגוסט 15, 2025

אודות המחבר