מהי בינה מלאכותית גנרטיבית?

אם חייתם לאחרונה בחלל כנראה שפספסתם את עלייתו של ChatGPT, הצאטבוט של OpenAI, שמנגיש בצורת שיח את מה שהוא כנראה מודל הטקסט המתקדם בעולם. רבים שיחקו איתו, הריצו עליו מניפולציות וניסו את כוחו בכל מיני ואריאציות, ואפילו שילבו אותו במסחר יומיומי. מהמעט שניסינו והדברים שעולים בשטח, אפשר לומר שהאפשרויות בלתי מוגבלות, וזה כמובן רק הסנונית הראשונה שהמודל הזה מביא איתו. 

מאמר נוסף שנוגע באפשרויות של בינה מלאכותית גנרטיבית, וכמו המאמר הקודם גם המאמר הזה מגיע מתוך ניסיון אישי והיבטי אבטחת מידע וסייבר, הבנה של האפשרויות ואיך ניתן לשלבן בתחום הגנה/תקיפה שהנושאים הסובבים של אבטחת מידע וסייבר. 

לאחר שנים ארוכות של מחקר, נראה כי הבינה המלאכותית מגיעה למעין נקודת מפנה, ולוכדת את דימיונם של רבים, החל מאוכלוסיה שחוסכת זמן בכתיבת החיבור לפרויקט ועד למנהיגים בחברות הטכנולוגיה הגדולות בעולם שמשלבים את הצאט בטנכנולוגיות שונות. לכן, נוצר עניין, סקרנות והתרגשות שהולכת וגוברת סביב האפשרויות שכלי בינה מלאכותית מביאים איתם. אבל מה בדיוק הכלים האלה מסוגלים? איך הם עובדים עדיין? ולאן יקחו אותנו? 

דבר אחד אפשר לומר, בינה מלאכותית גנרטיבית נותנת תוצאות מדהימות, פלט מוכן ומסייעת במקרים רבים שגם אינם טכנולוגיים ועם ניסיון רב, אך היא עדיין כמו ילד בן חמש שצריך הנחיות ברורות והבנה איך להנגיש את הנתונים.  

1ffa6 1673359083125

אפשר לומר שבינה מלאכותית גנרטיבית היא:

  • מתייחסת לקטגוריה של אלגוריתמים בתוך בינה מלאכותית שמייצרים תוצאות ופלט חדשים המבוססים על הנתונים שעליהם הם הוכשרו.
  • משתמשת בסוג של למידה עמוקה הנקראת רשתות יריבות גנרטיביות ויש לו מגוון רחב של יישומים, כולל יצירת תמונות, טקסט, שמע ועוד.
  • אומנם יש חששות לגבי ההשפעה של בינה מלאכותית על התעשייה ושוק העבודה, אך ישנם גם יתרונות פוטנציאליים כגון האפשרות להתמקד בתוכן העיקרי, בעבודה יצירתית ובעלת ערך מוסף.
בהתחשב בעובדה שכלים מתקדמים הפכו להיות כמו ChatGPT, זה רק נראה נכון לראות מה יש לבינה מלאכותית גנרטיבית לומר על עצמה. ללא עיכובים נוספים, בינה מלאכותית גנרטיבית כפי שמוסברת על ידי עצמה, בינה מלאכותית גנרטיבית.
1ea34 monosnap generative ai definition 2023 02 11 18 24 09

בינה מלאכותית גנרטיבית מתייחסת לקטגוריה של אלגוריתמים המפיקים תוצאות ופלט חדשים המבוססים על הנתונים שעליהם הם הוכשרו. בניגוד למערכות בינה מסורתיות שנועדו לזהות דפוסים ולבצע תחזיות, בינה מלאכותית גנרטיבית יוצרת תוכן חדש בצורה של תמונות, טקסט, שמע ועוד. בינה מלאכותית גנרטיבית משתמשת בסוג של למידה עמוקה הנקראת רשתות גנרטיביות (GANs) כדי ליצור תוכן חדש. המבנה של GAN מורכב משתי רשתות עצביות:

  • החלק (generator) שיוצר נתונים חדשים
  • החלק (discriminator) שמעריך את הנתונים.

שניהם עובדים יחד, כאשר החלק שיוצר בא לשפר את התפוקות שלו על סמך המשוב שהוא מקבל, ולאחר מכן החלק המאבחן שמעריך את הנתונים. כאמור, לבינה מלאכותית גנרטיבית יש מגוון רחב של יישומים, כולל:

תמונות – יכולה ליצור תמונות חדשות המבוססות על תמונות קיימות, כגון יצירת דיוקן חדש המבוסס על פניו של אדם או נוף חדש המבוסס על נוף קיים.
טקסט – לכתוב מאמרים, שירה ואפילו תסריטים. זה יכול לשמש גם כדי לתרגם טקסט משפה אחת לאחרת.
שמע – בינה מלאכותית גנרטיבית יכולה ליצור רצועות מוזיקה חדשות, אפקטים קוליים ואפילו משחק קולי.

תעשיות משובשות

לאנשים ותעשיות יש חששות שבינה מלאכותית גנרטיבית ואוטומציה יובילו לעקירת מקומות עבודה, שכן, מכונות הופכות להיות מסוגלות לבצע משימות שנעשו בעבר ע״י בני אנוש. ולכן, ישנו חשש שהשימוש הגובר בבינה מלאכותית יוביל לשוק עבודה מתכווץ, במיוחד בתעשיות כמו ייצור, שירות לקוחות, הזנת נתונים ואחרים.
לבינה מלאכותית גנרטיבית יש פוטנציאל לשבש מספר תעשיות, כולל:
פרסום – בינה מלאכותית גנרטיבית יכולה ליצור פרסומות חדשות המבוססות על פרסומות קיימות, מה שמקל על חברות להגיע לקהלים חדשים.
אמנות ועיצוב – בינה מלאכותית גנרטיבית יכולה לעזור לאמנים ומעצבים ליצור עבודות חדשות על ידי יצירת רעיונות ומושגים חדשים.
בידור – בינה מלאכותית גנרטיבית יכולה ליצור משחקי וידאו, סרטים ותוכניות טלוויזיה חדשים, מה שמקל על יוצרי תוכן להגיע לקהלים חדשים.

בתעשיית אבטחת מידע וסייבר ניתן לראות עניין רב של חברות טכנולוגיות, מומחים מכל הקשת וכל מי שמתעסק בדרך כזאת או אחרת. אפשר לומר שיש לזה יתרונות אך הוא עדיין רחוק מאוד מהנקודה שהוא יכול להחליף מגע אדם, בהגנה או תקיפה. חשוב להדגיש כי ישנם נושאים שהוא יכול לסייע באופן מהותי, למשל, פעולות שחוזרות על עצמן.    

בסך הכל, בעוד שיש חששות לגבי ההשפעה של בינה מלאכותית על טכנולוגיות, כלים ושוק העבודה, ישנם גם יתרונות פוטנציאליים רבים שיכולים להשפיע לטובה על העובדים ועל הכלכלה. בטווח הקצר, לכלי בינה מלאכותית גנרטיביים יכולות להיות השפעות חיוביות גם על שוק העבודה. לדוגמה, בינה מלאכותית יכולה להפוך משימות חוזרות וגוזלות זמן לאוטומטיות, ולעזור לבני אדם לקבל החלטות מהירות ומושכלות יותר על-ידי עיבוד וניתוח כמויות גדולות של נתונים. כלי בינה מלאכותית יכולים לפנות זמן לבני אדם להתמקד בעבודה יצירתית יותר ובעלת ערך מוסף.

מהו ChatGPT

ChatGPT (או בראשי התיבות שלו הוא Generative Pre-trained Transformer, וזה אומר במילים חופשיות טרנספורמר מאומן מראש בעל יכולת ייצור של שיח ויכולת לתשובות בעלות עניין ופלט עשיר. ChatGPT הוא צאט בוט מבוסס בינה מלאכותית שפותח על ידי חברת OpenAI. המודל עליו הוא בנוי נקרא GPT-3.5, אשר בנוי על GPT-3, ואומן תוך שימוש בשיטות של למידה בינה מלאכותית שונות.

זו הסיבה ש ChatGPT – ה-GPT מייצג יכולת גנרטיבית וכזאת שעברה הכשרה מוקדמת – מקבל כל כך הרבה תשומת לב כרגע. מדובר בצאט בוט שיכול לייצר תשובה כמעט לכל שאלה שהוא נשאל. הוא פותח על ידי OpenAI, ושוחרר לבדיקות לקהל הרחב בנובמבר 2022, וכבר נחשב לצאט בוט מבוסס הבינה המלאכותית הטוב ביותר אי פעם. וזה גם פופולרי: יותר ממיליון אנשים נרשמו להשתמש בו תוך חמישה ימים בלבד! תעשיות רבות פרסמו דוגמאות לכך שהצאט בוט מפיק קוד תקיפה, מודל הגנה, מאמרים ברמת הקולג', עבר הסמכות, יצר שירים ואפילו בדיחות.

a1d43 monosnap unlocking the potential of chatgpt in cybersecurity 2023 02 11 18 35 10
 קישור לתמונה Weird Ai Generations (@weirddalle) / Twitter

בעוד שרבים הגיבו ל ChatGPT ולבינה מלאכותית ולמידת מכונה באופן רחב יותר, אולי קצת בפחד, ללמידת מכונה יש בבירור פוטנציאל לתועלת. בשנים שחלפו מאז הפריסה הרחבה שלה, למידת מכונה הוכיחה השפעה במספר תעשיות, והשיגה דברים כמו שיפור יכולות זיהוי של מניפולציות תקיפה, ניתוח הדמיה רפואית ותחזיות מזג אוויר ברזולוציה גבוהה. סקר של מקינזי בשנת 2022 מראה שאימוץ הבינה המלאכותית יותר מהכפיל את עצמו בחמש השנים האחרונות, וההשקעה בבינה מלאכותית הולכת וגדלה.

ברור שלכלי בינה מלאכותית גנרטיביים כמו ChatGPT ואחרים כמו DALL-E (כלי לאמנות שנוצרה ע״י בינה מלאכותית) יש פוטנציאל לשנות את האופן שבו מגוון עבודות מבוצעות. עם זאת, היקפה המלא של השפעה זו עדיין אינו ידוע – וכך גם הסיכונים. אבל יש כמה שאלות שאנחנו יכולים לענות עליהן – כמו איך בנויים מודלים של בינה מלאכותית גנרטיבית, אילו סוגי בעיות הם הכי מתאימים לפתור, ואיך הם משתלבים בקטגוריה הרחבה יותר של למידת מכונה. המשך לקרוא כדי לקבל את ההורדה.

מה ההבדל בין למידת מכונה לבינה מלאכותית?

בינה מלאכותית היא פחות או יותר בדיוק מה שהיא נשמעת – הנוהג לגרום למכונות לחקות אינטליגנציה אנושית כדי לבצע משימות. סביר להניח שקיימת אינטראקציה עם בינה מלאכותית גם אם אינכם מבינים זאת – עוזרות קוליות כמו Siri או Alexa מבוססות על טכנולוגיית בינה מלאכותית, וכך גם צאטבוטים לשירות לקוחות שנולדים כל יום כדי לעזור בניווט באתרי אינטרנט.

למידת מכונה היא סוג של בינה מלאכותית. באמצעות למידת מכונה, מתרגלים מפתחים בינה מלאכותית באמצעות מודלים שיכולים ללמוד מדפוסי נתונים ללא הכוונה אנושית. הנפח והמורכבות העצומים של נתונים שאינם ניתנים לניהול על ידי בני אדם, בכל מקרה וכאלה ששנוצרים כעת הגדילו את הפוטנציאל של למידת מכונה, כמו גם את הצורך בה.

מהם הסוגים העיקריים של מודלים של למידת מכונה?

למידת מכונה מבוססת על מספר אבני בניין, החל מטכניקות סטטיסטיות קלאסיות שפותחו בין בתקופות קודמות עבור מערכי נתונים קטנים. בשנות ה-1930 וה-1940 של המאה ה-1970, חלוצי המחשוב – כולל המתמטיקאי התיאורטי אלן טיורינג – החלו לעבוד על הטכניקות הבסיסיות ללמידת מכונה. אבל הטכניקות האלה היו מוגבלות למעבדות עד סוף שנות השבעים, כאשר מדענים פיתחו לראשונה מחשבים חזקים מספיק כדי להרכיב אותם.

עד לאחרונה, למידת מכונה הייתה מוגבלת במידה רבה למודלים מנבאים, ששימשו להתבוננות וסיווג דפוסים בתוכן. לדוגמה, בעיה קלאסית של למידת מכונה היא להתחיל עם תמונה או כמה תמונות של, למשל, חתולים מקסימים. לאחר מכן התוכנה הייתה מזהה דפוסים בין התמונות, ולאחר מכן בוחנת תמונות אקראיות עבור כאלה שיתאימו לתבנית החתול המקסימה. בינה מלאכותית גנרטיבית הייתה פריצת דרך. במקום פשוט לתפוס ולסווג תמונה של חתול, למידת מכונה מסוגלת כעת ליצור תמונה או תיאור טקסט של חתול לפי דרישה.

כיצד פועלים מודלים מבוססי טקסט של למידת מכונה? איך הם מאומנים?

ChatGPT אולי מקבל את כל הכותרות עכשיו, אבל זה לא מודל למידת המכונה מבוסס הטקסט הראשון שעושה קפיצת מדרגה. המודלים הראשונים של למידת מכונה שעבדו עם טקסט אומנו על ידי בני אדם לסווג קלטים שונים על פי תוויות שנקבעו על ידי חוקרים. דוגמה אחת תהיה תמונה שהוכשרה לתייג פוסטים במדיה החברתית כחיוביים או שליליים. סוג זה של הכשרה ידוע בשם למידה מפוקחת כי אדם אחראי על הוראה המודל מה לעשות.

הדור הבא של מודלים מבוססי טקסט של למידת מכונה מסתמך על מה שמכונה למידה בפיקוח עצמי. סוג זה של אימון כרוך בהזנת מודל בכמות עצומה של טקסט, כך שהוא הופך להיות מסוגל ליצור תחזיות. לדוגמה, מודלים מסוימים יכולים לחזות, על סמך כמה מילים, כיצד יסתיים משפט. עם הכמות הנכונה של טקסט לדוגמה – למשל, חלק נרחב מהאינטרנט – מודלים אלה של טקסט הופכים מדויקים למדי. אנחנו רואים עד כמה הם מדויקים עם ההצלחה של כלים כמו ChatGPT.

מה נדרש כדי לבנות מודל AI גנרטיבי?

בניית מודל בינה מלאכותית גנרטיבית הייתה לרוב משימה גדולה, עד כדי כך שרק מעטים מאנשי הטכנולוגיה עתירי המשאבים עשו ניסיון. ל-OpenAI, החברה שעומדת מאחורי ChatGPT יש מיליארדים במימון מתורמים בעלי שם נועז. DeepMind היא חברת בת של אלפבית, חברת האם של גוגל, ומטא פרסמה את מוצר Make-A-Video שלה המבוסס על בינה מלאכותית גנרטיבית. חברות אלה מעסיקות כמה ממדעני המחשב והמהנדסים הטובים בעולם.

אבל זה לא רק כישרון. כשאתה מבקש ממודל להתאמן באמצעות כמעט כל האינטרנט, זה יעלה לך. OpenAI לא פרסמה עלויות מדויקות, אך הערכות מצביעות על כך ש-GPT-3 הוכשר על כ-45 טרה-בייט של נתוני טקסט – לצורך העניין, מיליויוני קיולמטרים של ספרים, או רבע מספריית הקונגרס כולה – בעלות מוערכת של כמה מיליוני דולרים. 

אילו סוגי פלט יכול מודל AI גנרטיבי לייצר?

תפוקות ממודלים גנרטיביים של בינה מלאכותית יכולות להיות בלתי ניתנות להבחנה מתוכן שנוצר על ידי בני אדם, או שהן יכולות להיראות קצת מוזרות. התוצאות תלויות באיכות הדגם – הפלטים של ChatGPT עד כה נראים עדיפים על אלה של קודמיו – ובהתאמה בין הדגם למקרה השימוש, או הקלט.

ChatGPT יכול להפיק "AI מוצק" המשווה תיאוריות שונות. מודלים אמנותיים שנוצרו על ידי בינה מלאכותית כמו DALL-E יכולים ליצור תמונות מוזרות ויפות לפי דרישה, כמו ציור של רפאל של מדונה וילד, אוכלים פיצה. מודלים אחרים של בינה מלאכותית גנרטיבית יכולים להפיק קוד , וידאו, אודיו או סימולציות עסקיות.

אבל הפלטים לא תמיד מדויקים – או מתאימים. כאשר מבקשים מ DALL-E 2 להמציא תמונה הוא יכול לתת קונוטציות אחרות ולא בהכרח ישירות לפי הבקשה. מצידה, נראה ש ChatGPT מתקשה לספור, או לפתור בעיות אלגברה בסיסיות – או, למעשה, להתגבר על ההטיה הסקסיסטית והגזענית שאורבת בזרמים התת-קרקעיים של האינטרנט והחברה באופן רחב יותר.

פלטי AI גנרטיביים הם שילובים מכויילים בקפידה של הנתונים המשמשים לאימון האלגוריתמים. מכיוון שכמות הנתונים המשמשת לאימון אלגוריתמים אלה היא כה מסיבית להפליא – כפי שצוין, GPT-3 אומן על 45 טרה-בתים של נתוני טקסט – המודלים יכולים להיראות יצירתיים בעת הפקת פלטים. יתרה מכך, הדגמים כוללים בדרך כלל אלמנטים אקראיים, מה שאומר שהם יכולים להפיק מגוון פלטים מבקשת קלט אחת – מה שגורם להם להיראות מציאותיים עוד יותר.

אילו סוגים של בעיות יכול מודל AI גנרטיבי לפתור?

ניתן להבחין שכלי בינה מלאכותית גנרטיביים כמו ChatGPT יכולים לייצר שעות אינסופיות של בידור. ההזדמנות ברורה גם בצד העסקי. כלי בינה מלאכותית גנרטיביים יכולים לייצר מגוון רחב של כתיבה אמינה תוך שניות, ואז להגיב לביקורת כדי להפוך את הכתיבה למתאימה יותר למטרה. יש לכך השלכות על מגוון רחב של תעשיות, החל מארגוני IT ותוכנה שיכולים להפיק תועלת מהקוד המיידי, הנכון ברובו, שנוצר על ידי מודלים של בינה מלאכותית ועד לארגונים הזקוקים לעותק שיווקי.

בקיצור, שצריך לייצר חומרים כתובים ברורים זה עשוי להועיל. ארגונים יכולים גם להשתמש בבינה מלאכותית גנרטיבית כדי ליצור חומרים טכניים יותר, כגון גרסאות ברזולוציה גבוהה יותר של תמונות רפואיות. ועם הזמן והמשאבים שנחסכים כאן, ארגונים יכולים לחפש הזדמנויות עסקיות חדשות ואת ההזדמנות ליצור ערך רב יותר.

ראינו שפיתוח מודל AI גנרטיבי הוא כל כך עתיר משאבים, שזה לא בא בחשבון עבור כל החברות מלבד הגדולות ובעלות המשאבים הטובים ביותר. לחברות המעוניינות להפעיל בינה מלאכותית גנרטיבית יש אפשרות להשתמש בבינה מלאכותית גנרטיבית מחוץ לקופסה, או לכוונן אותן לביצוע משימה ספציפית. אם עליך להכין שקופיות בהתאם לסגנון מסוים, לדוגמה, תוכל לבקש מהמודל "ללמוד" כיצד כותרות נכתבות בדרך כלל בהתבסס על הנתונים בשקופיות, ולאחר מכן להזין אותו בנתוני שקופיות ולבקש ממנו לכתוב כותרות מתאימות.

מגבלות של מודלים של בינה מלאכותית?

מכיוון שהם כל כך חדשים, עדיין לא ראינו את אפקט הזנב הארוך של מודלים גנרטיביים של בינה מלאכותית. משמעות הדבר היא שישנם כמה סיכונים אינהרנטיים הכרוכים בשימוש בהם – חלקם ידועים וחלקם לא ידועים.

הפלטים שמודלים גנרטיביים של בינה מלאכותית מפיקים עשויים להישמע לעתים קרובות משכנעים ביותר. זה לפי התכנון. אבל לפעמים המידע שהם מייצרים הוא פשוט לא נכון. גרוע מכך, לפעמים היא מוטה (משום שהיא בנויה על הטיות מגדריות, גזעיות ואינספור הטיות אחרות של האינטרנט והחברה באופן כללי) וניתן לתמרן אותה כדי לאפשר פעילות לא אתית או פלילית. לדוגמה, ChatGPT לא ייתן לך הוראות ישירות כיצד ליצור קוד זדוני, אבל אם נבבקש יפה וננס זאת אחרת, האלגוריתם שמח לציית. ארגונים המסתמכים על מודלים של בינה מלאכותית גנרטיבית צריכים לקחת בחשבון סיכוני מוניטין ומשפטיים הכרוכים בפרסום לא מכוון של תוכן מוטה, פוגעני או מוגן בזכויות יוצרים.

עם זאת, ניתן למתן סיכונים אלה בכמה דרכים. ראשית, חיוני לבחור בקפידה את הנתונים הראשוניים המשמשים לאימון מודלים אלה כדי להימנע מהכללת תוכן רעיל או מוטה. בשלב שלאחר מכן, במקום להשתמש במודל AI גנרטיבי מן המדף, ארגונים יכולים לשקול להשתמש במודלים קטנים ומתמחים יותר. ארגונים עם יותר משאבים יכולים גם להתאים אישית מודל כללי המבוסס על הנתונים שלהם כדי להתאים לצרכים שלהם ולמזער הטיות.

ארגונים צריכים גם להשאיר את האדם בעניינים (כלומר, לוודא שאדם אמיתי בודק את התפוקה של המודל הגנרטיבי לפני פרסומו או השימוש בו) ולהימנע משימוש במודלים של בינה מלאכותית גנרטיבית להחלטות קריטיות, כגון אלה הכרוכות במשאבים משמעותיים או ברווחה אנושית.

נוף הסיכונים וההזדמנויות צפוי להשתנות במהירות בשבועות, בחודשים ובשנים הקרובות. מקרי שימוש חדשים נבדקים מדי חודש, ודגמים חדשים צפויים להיות מפותחים בשנים הקרובות. ככל שהבינה המלאכותית הגנרטיבית משתלבת יותר ויותר, בצורה חלקה, בעסקים, בחברה ובחיינו האישיים, אנו יכולים גם לצפות לאקלים רגולטורי חדש שיתגבש. כאשר ארגונים מתחילים להתנסות – וליצור ערך – בכלים אלה, טוב יעשו מנהיגים אם ישימו את האצבע על הדופק של הרגולציה והסיכון.

You may also like...

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *