בינה בקיצור #1
13.9.24
BINA-BEKITZURבינה בקיצור
9/7/20242 דקה לקרוא
ברוכים הבאים לבינה בקיצור! 13.9.24
ניוזלטר חדש שינסה לסכם קצת את הדברים המעניינים שקרו השבוע בבינה המלאכותית הג'נרטיבית.
התוכן ידלג בין יצירות חדשות ומסקרנות, כלי AI ג'נרטיביים חדשים ותוכן טכני יותר שיעסוק בפלטפורמות ומודלים בקוד פתוח.
יאללה, מתחילים לג'נרט!
יצירות בינה מרשימות מהשבוע




קליפ AI מרגש של אודי קגן
אודי קגן שחרר קליפ מרגש ומרהיב ויזואלית העוסק בחוויות אישיות של פוסט-טראומה. הקליפ נוצר במלואו באמצעות כלי בינה מלאכותית, עם אודי קגן מאחורי רוב ההיבטים של ההפקה. אזהרה: התוכן עשוי להיות רגיש לצופים מסוימים.
פרסומת AI להמבורגר שנראית טוב
עם השקת כלים כמו RunwayML ו-Kling, הרשת הוצפה בפרסומות AI להמבורגרים (ורובן לא היו מדהימות). זו אחת חדשה (מיוצר קוריאני) שמצליחה באמת לעבוד - הרבה בזכות אפקטים קוליים ומוזיקה מצוינים . צפו בפרסומת
הפוסט המקורי - כאן.
חידושים בכלי AI




Flux מהיר על גבי Krea
קריאה שדרגה את השירות שלה שמאפשר להשתמש במודל פלאקס. כעת מתאפשרת יצירת תמונות במהירות מרשימה במיוחד.
מודל o1 של open ai
אופן AI מציגה את סדרת o1 החדשה - מודלים של בינה מלאכותית המתוכננים להקדיש זמן רב יותר לחשיבה לפני מתן תשובה. מודלים אלה מסוגלים לנתח משימות מורכבות ולפתור בעיות קשות יותר מאשר מודלים קודמים בתחומי המדע, התכנות והמתמטיקה.
הסדרה החדשה צפויה לשפר משמעותית את יכולות הניתוח והפתרון של בעיות מורכבות בתחומים מגוונים, ומסמנת התקדמות משמעותית בתחום הבינה המלאכותית.




עדכון Covers בסונו
מדובר בפיצ'ר מבטיח במיוחד - שמאפשר לכם לשנות את הסגנון של השיר / המוזיקה שתעלו לשירות וליצור לה קאבר בסגנונות שונים.
כיצד פועל Covers?
בחירת שיר שיצרתם מהספרייה שלכם בסונו או יצירת שיר חדש.
פתיחת תפריט האפשרויות ובחירה ב"Cover Song".
הגדרת הסגנון המוזיקלי החדש הרצוי.
החברה מעודדת משתמשים לנסות את הכלי עם הקלטות אישיות או שירים אהובים. עם זאת, נותר לראות כיצד ישפיע Covers על זכויות יוצרים וסוגיות אתיות בתעשייה.
פודקאסטים מטקסט עם NotebookLM
גוגל השיקה את NotebookLM,
כלי המאפשר יצירת פודקאסטים מטקסטים ומסמכים. הפוטנציאל עצום!
קוד פתוח ג'נרטיבי


אימון מודלים בעברית ב-ComfyUI
טיפים לאימון מודלים עבור מוצרים עם טקסט בעברית:
1. התמקדו בתווית: אמנו את המודל על התווית הכללית של המוצר, לא על הטקסט העברי עצמו.
2. תיאור כללי: בפרומפטים, השתמשו בתיאורים כמו "תווית של ממרח שוקולד" במקום "שוקולד השחר".
3. איכות תמונות: השתמשו בתמונות ברזולוציה גבוהה של התוויות המלאות.
4. הימנעו מפירוט אותיות: אל תנסו ללמד את המודל אותיות עבריות ספציפיו
5. בדיקת תוצאות: וודאו שהמודל מזהה ומייצר תוויות שלמות ולא רק טקסט בודד.
מטרת גישה זו היא לאפשר למודל לקלוט את המראה הכללי של תוויות בעברית, מבלי להתמקד בטקסט עצמו.
תודה לליאור רויטר ודיטסי על הטיפים!
*שוקולד השחר הזה נוצר באמצעות לורה שאומנה על שוקולד השחר (קרדיט - ליאור רויטר).


מודל FilmPortrait חדש
מודל Finetuned חדש על בסיס FLUX ליצירת תמונות בסגנון קולנועי- מאפשר ליצור אימג'ים מאוד מסוגננים עם תאורה וצבעוניות יחודית.
מוזמנים לבדוק אותו כאן - להורדה כאן.
ידעתם שאפשר לאמן לורה בשכבות?
השיטה מתמקדת באימון רק שתי שכבות ספציפיות במודל במקום כל השכבות: single_transformer_blocks.7.proj_out ו-single_transformer_blocks.20.proj_out.
היתרונות כוללים:
קבצי LORA קטנים יותר (עד 4.5MB)
אימון מהיר יותר (ב-30% לפחות)
חיסכון של 40% לפחות בזיכרון VRAM
שמירה על איכות גבוהה של התוצאות
השיטה מאפשרת אימון יעיל יותר של מאפייני פנים וגוף ללא השפעה על סגנון או אלמנטים אחרים.
המפתח מתכנן לפרסם כלי אימון ייעודי בקרוב, וצופה שהשיטה תאומץ על ידי כלי אימון קיימים.
לינק לדיונים המקוריים ברדיט ברדיט -
דנה אקרין גרין אימנה השבוע לורה על בסיס לוגו באמצעות פלאקס והגיעה לתוצאות מהממות!
הטיפים של דנה לתהליך מוצלח:
ניגשים לקלוד וכותבים לו שאנחנו רוצים לאמן מודל תמונה על לוגו אבל יש לנו רק תמונה אחת של הלוגו, אז שייצור לנו אפליקציית ווב פשוטה שתייצר לנו סט אימון מורחב של 10-15 תמונות - אותו לוגו בטילט, זום אין, אאוט, קצת blur, בהירות וכהות שונות, גם distort זה אחלה.
אם יש צורך מדייקים את הדרישות לקלוד עד שאנחנו מרוצים מהאפליקציה. מורידים את קובץ ה html לטלפון שלנו ופותחים עם הדפדפן
מעלים את התמונות שיצרנו באפליקציה החדשה שלנו לאימון לורה ב fal
https://fal.ai/models/fal-ai/flux-lora-general-training
תתנו מילת טריגר שלא קיימת בשפה האנגלית, נגיד logox
במקרה של לוגו פשוט יחסית 2000 צעדים יספיקו
ללוגו מורכב או לוגו בעברית תצטרכו יותר.
מחכים מחכים... כשהאימון נגמר מתחילים להריץ באתר של fal.
שימו לב - זה אף פעם לא 100% הצלחה, אבל יהיו הצלחות, שוב, תלוי במורכבות הלוגו
נסו לשמור על פרומפטים פשוטים וברורים.
אם יש טקסט באנגלית בלוגו תציינו אותו בפרומפט.
אם יש יותר מדי כשלונות, תעלו את ה cfg scale בהגדרות של הרצת הפרומפט ב fal.
רוצים לראות מה יצא לדנה מהלוגו של כאן 11 ?
זה כאן
ועוד טיפ קטן לסיום -
כשאנחנו מאמנים על לוגו יש לנו בד"כ תמונה אחת שלו. אבל תמונה אחת של לוגו לא מספיקה כדי לאמן מודל בצורה טובה מספיק, אז אנחנו עושים משהו שנקרא אוגמנטציה של הדאטה סט, שזו הרחבה של סט האימון באופן מלאכותי ומייצרים תמונות של אותו הלוגו בדרכים קצת שונות. עבור מוצר צריך תמונות של המוצר בזוויות שונות.
כמה דברים קטנים לפני שהולכים לנוח:
הסבר טכני על אימון לורות, כן זה מפחיד (אבל יש ציורים), כאן
נראה שאפשר לאמן לורה על בסיס פלאקס גם עם יש רק 8GB VRAM בכרטיס המסך שלכם!
זה ייקח 17 שעות והתוצאות לא בטוח יהיו הכי מלהיבות, אבל הי - זה אפשרי.תודה לבני מלי מקהילת Custom Beer Node על השיתוף
רוצים להיזרק קצת אחורה בזמן? יאללה
מיזם מרגש וחשוב לקראת ציון ה7.10 - גלויות של תקווה: לעוד פרטים
רוצים לקבל את הניוזלטר ישירות לתיבת האימייל שלכם?
הירשמו כאן
---
למי שפספס, שני סרטונים חדשים עלו לערוץ היוטיוב:
אימון לורה באופן מקומי באמצעות הכלי Fluxgym בפינוקיו.
תודה לכל מי ששרדו עד כאן😅
נתראה בניוזלטר הבא!