אם אתם יכולים לדמיין את זה, אתם יכולים לייצר את זה.
ככה תמיד חשבתי. אלא שהיום כבר לא חייבים לדמיין.
מאז שתוכנת הבינה המלאכותית דאלי נכנסה לחיי לפני כשבועיים,
דברים שלא ידעתי לדמיין התגשמו לנגד עיני בהקלדת משפט פשוט באנגלית.
למשל, צפרדע עושה מדיטציה מעל נהר:
או צבא של רובוטים המרושעים:
והנה קיפוד סוריאליסטי ביום הראשון לבית הספר
את התמונות האלו יצרה מערכת הבינה המלאכותית דאלי (DallE) לבקשתי, תוך שניות, כנגד עיני המשתאות. מה זה דאלי, איך עובדים עם דאלי ואיך ניתן להשתמש בו ובבינה מלאכותית ביצירת משחקים?
מה זה דאלי?
דאלי היא מערכת של בינה מלאכותית מבית היוצר של חברת OpenAI. היא יודעת ליצור תמונות בכל סגנון אפשרי ממשפט אשר נכתבת לה בשפת בני אנוש.
איך עובדים עם דאלי?
לדאלי יש את הממשק הכי פשוט ונוח ליצירת ארט שאי פעם ראיתם בכל תוכנה שהיא. כל מה שצריך זה לכניס משפט (מה שנקרא פרומפט), שדאלי מתרגם לשפת מכונה, חושב על זה כמה שניות, ואז יורק שש גרסאות של מה שהוא הבין ממה שחשבתם.
ככל שתדייקו יותר בפרומפט כך דאלי יקלע יותר לבקשה שלכם. כך למשל, אפשר לבקש ציור של ילדה מחזיקה דובי בתחנת רכבת, נראית עצובה, בסגנון פופ ארט.
או דובי מפלרטט עם אישה צעירה וג׳ינגית בבר, להקת ג׳ז מנגנת ברקע.
איפה להקת הג׳ז אתם שואלים?
לא ברור. לא ברור אם דאלי התייחס לחלק הזה של המשפט והאם היתה השפעה על התמונה, מה שבטוח, הם לא בפנים, ומה שקרה בעשר השניות האלו שבין שליחת הפרומפט לתוצר של דאלי כנראה איש לא לגמרי יבין.
אבל בטוח שהיצירה יצירתית מאוד.
דאלי בעצם עושה אינטרפטציה לפרומפט שלכם, ועל סמך מיליונים של תמונות שלמד מייצר קומפוזיציה חדשה שמעולם לא נראתה לפני כן. והתוצאות כפי שעיניכם רואות מרהיבות, אך קשה לשלוט בתוצר. דאלי לא עקבי, אין לדעת בדיוק מה יצא ואי אפשר לצפות לתוצאה שתתאר במדויק את הפרומפט שכתבתם. צפו ללא צפוי, אך היו מוכנים להישאר עם הלסת על הרצפה.
האם אפשר להשתמש בדאלי ליצירת משחקים?
נכון לכתיבת שורות אלו, לא ניתן לאלף את הסוס הפראי הזה לייצר, למשל, את אותה הדמות בדיוק בזויות שונות, או ליצור הרבה רקעים בעלי אופי אחיד. מה שכן אפשר לעשות, ובקלות בלתי נסבלת, היא ליצור קונספט ארט. נגיד שיש לכם רעיון לדמות. למשל, חולדה סמוראית. אתם בכלל לא יודעים איך דבר כזה יראה, אז אפשר לבקש מדאלי שיצור אותה עבורכם. למשל:
אוקי! אני מקווה שאתם מתרשמים לפחות כמוני מהתוצאה.
עכשיו אפשר לקחת את אותו הפרומפט בדיוק ולהחליף את הסגנון, כדי לראות איך הסמוראי שלנו נראה בשינוי אדרת.
והנה לפנינו עבודת קונספט ארט מרשימה מאוד (!) שהיתה לוקחת כשבוע ימים למאיירים מוכשרים מאוד, וכל זה בפחות מעשר דקות. אני בהחלט יכול לראות איך סטודיו משחקים בודק המון אופציות תוך שעות ספורות לפני שהוא ננעל על הסגנון שמתאים לו, וחוסך עבודה מטורפת.
את אותה הגישה אפשר לאמץ ליצירת כל אספקט גרפי אחר במשחק שלנו. הנה מספר וריאציות לאייקון של המשחק שלנו:
כאן אנחנו רואים מספר וריאציות של דאלי על תמונה אחת (השמאלית מלמעלה) שדאלי יצר. גם כאן, לא מושלם, אך מהווה בסיס טוב ליצירה על גבי הרעיונות של דאלי.
לא רק ארט
הגישה לדאלי נותנת גם גישה למודל חיזוי השפה של OpenAI שנקרא GPT-3. הבינה המלאכותית הזו יודעת לדבר איתכם בצורה מאוד משכנעת וגם לכתוב מאמרים, דיאלוגים, פוסטים לבלוג שלכם. ביקשתי ממנו למשל, לכתוב דיאלוג בין הסמוראי שלי לאויב המושבע שלו, עורב בשם נמסיס. זה מה שיצא בתוך שניות:
Samurai Rat: I will defeat you and reclaim my honor!
Nemesis: You're nothing but a rat! You're not even worth my time!
Samurai Rat: I will not be underestimated! I will defeat you and regain my honor!
Nemesis: We'll see about that!
אוקי. קצת בנאלי, אבל כבר שיחקתי במשחקים עם טקסטים פחות טובים מאלו.
אני לא חושב שמחר בבוקר מחשב יכתוב דיאלוגים למשחק שלם, אבל כבר עכשיו הוא בהחלט יכול לתת בסיס. התחלה של משהו.
תארו לעצמכם דבר נוסף. לו דמויות במשחקי מחשב היו מקושרות למודל כמו GPT-3, בעזרת יד מכוונת של יוצרי המשחק, כל דיאלוג בין הדמויות יהיה לעד שונה. לא עוד דמות שאומרת "סליחה, אבל אני לא יכולה להשתמש בחפץ הזה" פעם אחר פעם, אלא אינסוף וריאציות על המלל הזה, כך שכל חווית משחק תהיה שונה.
אני מתרגש לחשוב מה בני אדם יוכלו, בעצם כבר יכולים ליצור בשימוש הכלים החכמים האלו.
***
אהבתם את הכתבה? רוצים לקבל כתבות מעולות על עיצוב משחקים + שני ספרים במתנה?
כנסו ללינק. קבלו תוכן מעולה לאינבוקס. ביי.
לא הבנתי איך ניתן לקבל גישה לאפליקציה הזאת? באינטרנט ניתן למצוא רק את גרסאת מיני שהיא הרבה פחות טובה. ובאתר של DallE2 אומרים שניתן להיכנס לרשימת המתנה...