פיתחתי סטודיו AI שמסוגל לייצר דמויות עקביות באיכות גבוהה

תוכן עניינים

הסוד נמצא בפרטים.

פיתחתי סטודיו AI ליצירת דמויות עקביות ובו אני משתמש דרך Fal בכל מיני סוגים של API כדי לחבר הכל ביחד. משתמש בוחר תמונה, כדי לזהות את הלבוש במדויק אני משתמש ב-API של Flux Kontext. אח״כ אני מבצע קריאת API ל-Ideogram Edit כדי לדאוג שהפנים והגוף יקבלו את אותו דיוק מהתמונה המקורית. חיבור של שני מודלים בקלות יתירה דרך Fal תוך שימוש בקלוד קוד לפיתוח.

ל-Fal אפילו יש הנחיות ל-LLM עבור כל API מה שהופך הכל לקל יותר. זה סטנדרט שהתעשייה מאמצת שנקרא llm.txt, כל שירות API יתחיל ליישם קובץ כזה בשירות שלו שמסביר ל-LLMs איך להתחבר אליו בקלות. זה הכרחי. אבל, במה שעשיתי אין חידוש גדול. כל אחד יכול. הסוד נמצא לא בזה שחיברתי 2 מודלים. הסוד נעוץ במה שעשיתי בין לבין ותוך כדי. מלבד שני המודלים האלה, הוספתי עוד מספר שכבות כדי להגיע לדיוק מקסימלי.

השכבות האלה פועלות באמצעות AI Agent שאחראי לקבל את הפרומפט ולוודא דרך כמה טכניקות שונות שהתוצר יתאים למה שביקשנו. גם בתווי הפנים וגם בפריטי הלבוש. לא רק זה. אלא יכולת לג׳נרט מספר דמויות בתמונה אחת, מפרומפט בודד, וכל זה בלי לאמן מודל. כל מה שצריך לעשות זה להעלות תמונת רפרנס אחת בלבד, וגם מקבלים דיוק מקסימלי, אבל גם אפשר לשלב כמה דמויות שרוצים בתמונה, וסוכן ה-AI המתקדם שלי דואג לבצע את כל הקסם ואת כל התזמורת עם כל המודלים והטכניקות שהגדרתי עם קלוד קוד מתחת למכסה המנוע.

שני המודלים שחיברתי הם אחלה והם לגמרי עושים את העבודה מצוין מתמונת רפרנס אחת. אבל זה לא מספיק וגם לא מחדש. בעיניי, היצירתיות מסתתרת בדרכים שאינן השביל הראשי. היות וזה מוצר שאני אעלה לאוויר, אני לא מפרסם את הפרטים ככה בריש גלי של מה שקורה בין לבין, אבל כן אגיד שזה לא רק שימוש ב-2 מודלים, אלא שילוב של לפחות עוד 4 תהליכים שונים ובניית תשתית אג׳נטית שמבטיחה תוצאות טובות יותר.

יש פה AI Agent מתקדם שאחראי על הכל והוא קבלן הביצוע. גם אם כולם בונים עם מלט ובטון וחצץ וחול (המודלים בדוגמא שלנו), הוא אחראי על הארכיטקטורה של הכל ועל ביצוע בפועל. אם יש לכם תמונות רפרנס שתרצו שאריץ סטודיו שלי אתם מוזמנים להדביק בתגובות עם פרומפט ואני אשתדל להעלות לסטודיו ולהדביק לכם חזרה את התוצאות כדי שתוכלו להתרשם. עד שאפתח למשתמשים.

רוצים כמה דוגמאות? קבלו:

לקחתי את התמונה הזו של הרבי:

תמונת הרפרנס המקורית של הרבי מתפלל ב-770

והסטודיו שלי יצר את זה:

הרבי מליובאוויטש ברחובות ניו יורק, הלבוש שלו מדויק 99% (מלבד הרצועה בצד ימין, והידיים המשולבות)

דוגמא נוספת, תמונת המקור היא:

תמונת המקור מהסרט חגיגה בסנוקר, זאב רווח משחק את "חכם חנוכה"

והסטודיו שלי יצר את זה:

דוגמא נוספת ליצירה על בסיס תמונת רפרנס בסטודיו:

ולהבדיל, יש בסטודיו אפילו מודל לבובו שאימנתי שיכול לייצר כאלה דברים יפים:

יאללה תאתגרו את הסוכן ואני מזכיר שמחיר ההשקה של הקורס שלי (וייב קודינג עם קלוד קוד) יהיה זמין רק עד סוף אוגוסט, ממליץ לנצל ולהצטרף לכל מי שכבר עלה על הרכבת, כל הפרטים באקדמיה שלי:

האקדמיה לבינה מלאכותית של יובל אבידני - YUV.AI Academy

נוצר עם schooler מבית רב מסריובל אבידני

ומה חשבתם? אשמח לקרוא!

שבת שלום ובשורות טובות בתפילה להשבת חטופינו בריאים ושלמים בגוף ובנפש בקרוב ממש, ולהחזרת כוחות הביטחון בשלום הביתה!!!

יובל

תוייג ב

studio, ai, labubu, ideogram, fal, kontext, flux

עדכון אחרון אוגוסט 15, 2025

פיתחתי סטודיו AI שמסוגל לייצר דמויות עקביות באיכות גבוהה - בואו לראות את התוצרים!

תוכן עניינים

הסוד נמצא בפרטים.

אודות המחבר

Yuval Avidani

Q-Star v3: סוכן AI שמתקן את עצמו ומבטל הזיות בקוד

SWE-agent 2.0: הנדסת תוכנה אוטונומית עם AI בקוד פתוח

תוכן עניינים

הסוד נמצא בפרטים.

הרשמה לניוזלטר שלנו

אודות המחבר

מאמרים קשורים