לפידות וינברגר
- 28 בנוב׳ 2023
- זמן קריאה 2 דקות

התנהלות בלתי חוקית או התנגשות בלתי נמנעת? המאבק המשפטי על זכויות יוצרים בעידן הבינה המלאכותית

עודכן: 21 בינו׳

בשבועות האחרונים התנהל בבית המשפט הפדרלי בסן פרנסיסקו קרב משפטי יוצא דופן בין הקומיקאית שרה סילברמן וקבוצת יוצרים נוספים לבין חברת הענק מטא (לשעבר פייסבוק). התובעים טענו כי השימוש הנרחב שעשתה מטא בספריהם לצורך אימון מודלי בינה מלאכותית, מהווה הפרה בוטה של זכויות היוצרים שלהם. אז מהם מודלי שפה מלאכותית ואיך בדיוק זה קשור לזכויות יוצרים?

תמונה אבסטרקטית של זכויות יוצרים על אימון מודלי שפה ותוצריהם — המאבק המשפטי על זכויות יוצרים באימון של מודלי שפה ישפיע רבות על העידן החדש

בשנים האחרונות אנו עדים לפריצות דרך מרשימות בתחום הבינה המלאכותית, ובפרט ביכולות ה"שפה" של מכונות. מודלים מתקדמים כגון GPT-4 מסוגלים כבר היום לנהל שיח טבעי עם בני אדם, לכתוב מאמרים, שירים ואפילו קוד מחשב.

אבל איך בדיוק המודלים הללו לומדים להבין ולהפיק שפה אנושית כל כך היטב? התשובה נעוצה בתהליך האימון הממושך שהם עוברים על מאגרי טקסט עצומים, לעיתים בני מיליוני ספרים דיגיטליים. המודל "קורא" מספר רב ככל האפשר של ספרים ומיינן אותם למשפטים ופסקאות. באמצעות אלגוריתמים מתקדמים הוא "לומד" לנתח שפה, להבין קשרים לוגיים בין מילים ורעיונות, ולבסוף להפיק טקסט הגיוני בעצמו.

התביעה של שרה סילברמן נגד חברת מטא

בשבועות האחרונים התנהל בבית המשפט הפדרלי בסן פרנסיסקו קרב משפטי יוצא דופן בין הקומיקאית שרה סילברמן וקבוצת יוצרים נוספים לבין חברת הענק מטא (לשעבר פייסבוק).

סילברמן ושותפיה טוענים כי מטא השתמשה ללא רשות בספריהם כ"מזון" למודלי הבינה המלאכותית שהיא מפתחת. כלומר, שהיא האכילה את המודלים באופן בלתי חוקי ביצירות המוגנות שלהם כדי "לחנך" אותם ולשפר את יכולות השפה שלהם. מבחינתם, זו הפרה בוטה של זכויות היוצרים שלהם, שמזכה אותם בפיצוי כספי. מצד שני, מטא טוענת שהשימוש שנעשה ביצירות מוגן במהלך אימון המודלים הוא לגיטימי וחוקי בהיותו שימוש הוגן למטרות לימוד ומחקר.

זהו תיק תקדימי שיקבע האם חברות טכנולוגיה יוכלו להמשיך ולעשות שימוש חופשי ביצירות מוגנות לצורך קידום החדשנות שלהן, או שמא יאלצו לבקש אישור ולשלם על כל שימוש כזה. ההכרעה צפויה להשפיע עמוקות הן על קצב וכיוון ההתפתחות של מודלים מתקדמים כגון GPT-4 ו-PaLM והן על ההגנה על זכויות יוצרים בעידן הבינה המלאכותית

מודלי LLM, יצירה נגזרת, התעשרות שלא כדין

בבסיס התביעה עמדה הטענה שמודלי שפה מלאכותיים (LLM) כמו GPT-3 של OpenAI הם למעשה יצירות נגזרות של החומרים ששימשו כדי לאמן אותם. התובעים טענו גם לתחרות בלתי הוגנת, התעשרות שלא כדין ורשלנות מצד החברות. אולם השופט וינס צ'אבריה דחה לאחרונה את הטענות בדבר יצירות נגזרות, הפרת זכויות יוצרים ותחרות בלתי הוגנת. לדבריו, התובעים לא הציגו ראיות מוצקות לטענותיהם.

יחד עם זאת, השופט השאיר פתח להמשך המאבק המשפטי סביב סוגיית ההעתקה הלא חוקית של ספרים לצורך אימון מודלי ה-LLM. הפסיקה נחשבת לתקדימית ופותחת צוהר לשאלות מהותיות לגבי הגנה על קניין רוחני בעידן הבינה המלאכותית.

העתקה בלתי חוקית, הגנת קניין רוחני, תקדים משפטי

סילברמן ושותפיה טענו כי המודלים מנו באמצעות מאגרי ספרים עצומים שלא פורסמו באופן חוקי. לטענתם, 15% ממאגר האימון של GPT-3 מגיע משני מאגרים מחשידים בשם "Books1" ו-"Books2" המכילים מעל 350,000 ספרים שנלקחו כנראה מספריות צללים בלתי חוקיות באינטרנט.

אם הטענות נכונות, המקרה ממחיש כיצד חברות ענק כמו מטא ו-OpenAI מנצלות חומרים גנובים כדי לקדם את האינטרסים הכלכליים שלהן תוך התעלמות מזכויות היוצרים. זוהי דוגמה מטרידה לאופן שבו טכנולוגיות מתקדמות עלולות לשמש כלי ניצול בידיים הלא נכונות.

התעלמות מזכויות יוצרים בעידן הבינה המלאכותית

סילברמן ושותפיה רואים בתביעה מקרה בוחן למאבק רחב יותר להגנת הקניין הרוחני של יוצרים. הם מבקשים לקבוע תקדימים משפטיים שיגנו על זכויות יוצרים בנסיבות שבהן חברות ענק עושות שימוש נרחב ביצירות ללא רשות. זהו קרב דוד נגד גוליית שתוצאותיו עשויות להשפיע עמוקות על האופן שבו נתפוס את הקשר בין טכנולוגיה, אתיקה וזכויות יוצרים בעידן המודרני. מוזמנים לעקוב אחר ההתפתחויות בפרשה מרתקת זו

המכון הישראלי למשפט ובינה מלאכותית

התנהלות בלתי חוקית או התנגשות בלתי נמנעת? המאבק המשפטי על זכויות יוצרים בעידן הבינה המלאכותית

התביעה של שרה סילברמן נגד חברת מטא

מודלי LLM, יצירה נגזרת, התעשרות שלא כדין

העתקה בלתי חוקית, הגנת קניין רוחני, תקדים משפטי

התעלמות מזכויות יוצרים בעידן הבינה המלאכותית

פוסטים אחרונים

Comentários

נשמח ללוות גם אתכם