בינה בקיצור #1

13.9.24

BINA-BEKITZURבינה בקיצור

9/7/20242 דקה לקרוא

ברוכים הבאים לבינה בקיצור! 13.9.24

ניוזלטר חדש שינסה לסכם קצת את הדברים המעניינים שקרו השבוע בבינה המלאכותית הג'נרטיבית.

התוכן ידלג בין יצירות חדשות ומסקרנות, כלי AI ג'נרטיביים חדשים ותוכן טכני יותר שיעסוק בפלטפורמות ומודלים בקוד פתוח.

יאללה, מתחילים לג'נרט!

יצירות בינה מרשימות מהשבוע

קליפ AI מרגש של אודי קגן

אודי קגן שחרר ​קליפ מרגש ומרהיב ויזואלית​ העוסק בחוויות אישיות של פוסט-טראומה. הקליפ נוצר במלואו באמצעות כלי בינה מלאכותית, עם אודי קגן מאחורי רוב ההיבטים של ההפקה. אזהרה: התוכן עשוי להיות רגיש לצופים מסוימים.

פרסומת AI להמבורגר שנראית טוב

עם השקת כלים כמו RunwayML ו-Kling, הרשת הוצפה בפרסומות AI להמבורגרים (ורובן לא היו מדהימות). זו אחת חדשה (מיוצר קוריאני) שמצליחה באמת לעבוד - הרבה בזכות אפקטים קוליים ומוזיקה מצוינים . ​צפו בפרסומת ​

הפוסט המקורי - ​כאן​.

חידושים בכלי AI

Flux מהיר על גבי Krea

קריאה שדרגה את השירות שלה שמאפשר להשתמש במודל פלאקס. כעת מתאפשרת יצירת תמונות במהירות מרשימה במיוחד.

​צפו בהדגמה כאן​.

מודל o1 של open ai

אופן AI מציגה את סדרת o1 החדשה - מודלים של בינה מלאכותית המתוכננים להקדיש זמן רב יותר לחשיבה לפני מתן תשובה. מודלים אלה מסוגלים לנתח משימות מורכבות ולפתור בעיות קשות יותר מאשר מודלים קודמים בתחומי המדע, התכנות והמתמטיקה.

הסדרה החדשה צפויה לשפר משמעותית את יכולות הניתוח והפתרון של בעיות מורכבות בתחומים מגוונים, ומסמנת התקדמות משמעותית בתחום הבינה המלאכותית.

עדכון Covers בסונו

מדובר בפיצ'ר מבטיח במיוחד - שמאפשר לכם לשנות את הסגנון של השיר / המוזיקה שתעלו לשירות וליצור לה קאבר בסגנונות שונים.

כיצד פועל Covers?

בחירת שיר שיצרתם מהספרייה שלכם בסונו או יצירת שיר חדש.

פתיחת תפריט האפשרויות ובחירה ב"Cover Song".

הגדרת הסגנון המוזיקלי החדש הרצוי.

החברה מעודדת משתמשים לנסות את הכלי עם הקלטות אישיות או שירים אהובים. עם זאת, נותר לראות כיצד ישפיע Covers על זכויות יוצרים וסוגיות אתיות בתעשייה.

פודקאסטים מטקסט עם NotebookLM

גוגל השיקה את ​NotebookLM​,

כלי המאפשר יצירת פודקאסטים מטקסטים ומסמכים. הפוטנציאל עצום!

​מדריך קצר לשימוש​.

קוד פתוח ג'נרטיבי

אימון מודלים בעברית ב-ComfyUI

טיפים לאימון מודלים עבור מוצרים עם טקסט בעברית:

1. התמקדו בתווית: אמנו את המודל על התווית הכללית של המוצר, לא על הטקסט העברי עצמו.
2. תיאור כללי: בפרומפטים, השתמשו בתיאורים כמו "תווית של ממרח שוקולד" במקום "שוקולד השחר".
3. איכות תמונות: השתמשו בתמונות ברזולוציה גבוהה של התוויות המלאות.
4. הימנעו מפירוט אותיות: אל תנסו ללמד את המודל אותיות עבריות ספציפיו
5. בדיקת תוצאות: וודאו שהמודל מזהה ומייצר תוויות שלמות ולא רק טקסט בודד.

מטרת גישה זו היא לאפשר למודל לקלוט את המראה הכללי של תוויות בעברית, מבלי להתמקד בטקסט עצמו.

תודה לליאור רויטר ודיטסי על הטיפים!

*שוקולד השחר הזה נוצר באמצעות לורה שאומנה על שוקולד השחר (קרדיט - ליאור רויטר).

מודל FilmPortrait חדש

מודל Finetuned חדש על בסיס FLUX ליצירת תמונות בסגנון קולנועי- מאפשר ליצור אימג'ים מאוד מסוגננים עם תאורה וצבעוניות יחודית.

מוזמנים לבדוק אותו כאן - ​להורדה כאן​.


ידעתם שאפשר לאמן לורה בשכבות?


השיטה מתמקדת באימון רק שתי שכבות ספציפיות במודל במקום כל השכבות: single_transformer_blocks.7.proj_out ו-single_transformer_blocks.20.proj_out.

היתרונות כוללים:

קבצי LORA קטנים יותר (עד 4.5MB)
אימון מהיר יותר (ב-30% לפחות)
חיסכון של 40% לפחות בזיכרון VRAM
שמירה על איכות גבוהה של התוצאות

השיטה מאפשרת אימון יעיל יותר של מאפייני פנים וגוף ללא השפעה על סגנון או אלמנטים אחרים.

המפתח מתכנן לפרסם כלי אימון ייעודי בקרוב, וצופה שהשיטה תאומץ על ידי כלי אימון קיימים.

לינק לדיונים המקוריים ברדיט ברדיט -

כאן וכאן

דנה אקרין גרין אימנה השבוע לורה על בסיס לוגו באמצעות פלאקס והגיעה לתוצאות מהממות!

הטיפים של דנה לתהליך מוצלח:

ניגשים לקלוד וכותבים לו שאנחנו רוצים לאמן מודל תמונה על לוגו אבל יש לנו רק תמונה אחת של הלוגו, אז שייצור לנו אפליקציית ווב פשוטה שתייצר לנו סט אימון מורחב של 10-15 תמונות - אותו לוגו בטילט, זום אין, אאוט, קצת blur, בהירות וכהות שונות, גם distort זה אחלה.

אם יש צורך מדייקים את הדרישות לקלוד עד שאנחנו מרוצים מהאפליקציה. מורידים את קובץ ה html לטלפון שלנו ופותחים עם הדפדפן

מעלים את התמונות שיצרנו באפליקציה החדשה שלנו לאימון לורה ב fal

https://fal.ai/models/fal-ai/flux-lora-general-training

תתנו מילת טריגר שלא קיימת בשפה האנגלית, נגיד logox

במקרה של לוגו פשוט יחסית 2000 צעדים יספיקו
ללוגו מורכב או לוגו בעברית תצטרכו יותר.
מחכים מחכים... כשהאימון נגמר מתחילים להריץ באתר של fal.
שימו לב - זה אף פעם לא 100% הצלחה, אבל יהיו הצלחות, שוב, תלוי במורכבות הלוגו
נסו לשמור על פרומפטים פשוטים וברורים.
אם יש טקסט באנגלית בלוגו תציינו אותו בפרומפט.
אם יש יותר מדי כשלונות, תעלו את ה cfg scale בהגדרות של הרצת הפרומפט ב fal.

רוצים לראות מה יצא לדנה מהלוגו של כאן 11 ?

זה כאן

ועוד טיפ קטן לסיום -

כשאנחנו מאמנים על לוגו יש לנו בד"כ תמונה אחת שלו. אבל תמונה אחת של לוגו לא מספיקה כדי לאמן מודל בצורה טובה מספיק, אז אנחנו עושים משהו שנקרא אוגמנטציה של הדאטה סט, שזו הרחבה של סט האימון באופן מלאכותי ומייצרים תמונות של אותו הלוגו בדרכים קצת שונות. עבור מוצר צריך תמונות של המוצר בזוויות שונות.

כמה דברים קטנים לפני שהולכים לנוח:

הסבר טכני על אימון לורות, כן זה מפחיד (אבל יש ציורים), כאן

נראה שאפשר לאמן לורה על בסיס פלאקס גם עם יש רק 8GB VRAM בכרטיס המסך שלכם!
זה ייקח 17 שעות והתוצאות לא בטוח יהיו הכי מלהיבות, אבל הי - זה אפשרי.תודה לבני מלי מקהילת Custom Beer Node על השיתוף

רוצים להיזרק קצת אחורה בזמן? יאללה

מיזם מרגש וחשוב לקראת ציון ה7.10 - גלויות של תקווה: לעוד פרטים

רוצים לקבל את הניוזלטר ישירות לתיבת האימייל שלכם?

הירשמו כאן

---

למי שפספס, שני סרטונים חדשים עלו לערוץ היוטיוב:

אימון לורה באופן מקומי באמצעות הכלי Fluxgym בפינוקיו.

תודה לכל מי ששרדו עד כאן😅
נתראה בניוזלטר הבא!