رئيس مايكروسوفت للذكاء الاصطناعي يثير الجدل حول استخدام البيانات على الإنترنت
أثارت تصريحات مصطفى سليمان، رئيس قطاع الذكاء الاصطناعي لدى شركة مايكروسوفت، جدلًا واسعًا حول رأيه في استغلال البيانات والمحتوى المنشور على الإنترنت لتدريب نماذج الذكاء الاصطناعي دون إذن مسبق من أصحابها، في تقليل واضح من أهمية حماية الملكية الفكرية لأنواع المحتوى المنشور على الإنترنت.
مسألة استخدام البيانات والمحتوى العام على الإنترنت لتدريب الذكاء الاصطناعي، هي واحدة من الملفات الشائكة في الوقت الحالي، والتي تمثل مشكلة بالنسبة للشركات التي تعمل في تطوير نماذج الذكاء الاصطناعي، والتي تحتاج إلى حجم ضخم من البيانات لتدريب النماذج، حيث يعتبر الكثيرون أن استغلال المحتوى المنشور على الإنترنت في هذا الغرض أمر مخالف لحقوق الملكية الفكرية، ويجب سن قوانين تمنع ذلك.
في هذا الشأن، كان هناك حديث من جانب رئيس الذكاء الاصطناعي في مايكروسوفت، مصطفى سليمان، لـ CNBC، والذي أثار جدلًا، بعد أن أبدى المسئول اعتقاده أن نشر أي محتوى على الويب المفتوح يجعله “مجانيًا” يمكن لأي شخص نسخه واستخدامه بحرية.
عندما سأل أندرو روس سوركين، من CNBC ، سليمان عما إذا كانت “شركات الذكاء الاصطناعي قد سرقت فعليًا حقوق الملكية الفكرية للعالم من المحتوى المنشور على الإنترنت لتدريب نماذجها الخاصة”، أجاب سليمان:
“أعتقد أنه بالنسبة للمحتوى الموجود بالفعل على الويب المفتوح، فإن العقد الاجتماعي لهذا المحتوى منذ التسعينيات كان يُعتبر استخدامًا عادلًا، بحيث يمكن لأي شخص نسخه، إعادة إنشائه، إعادة إنتاجه، لقد كان هذا الفهم السائد.”
تأتي هذه التصريحات لتثير الجدل، حيث تعتبر القوانين أن أي من أشكال المحتوى المنشور على مصادر ذات تراخيص ورقابة، يتم حمايتها تلقائيًا بحقوق الطبع والنشر في الولايات المتحدة، وبالتالي غير مسموح لأطراف ثالثة استغلالها في تطوير أو تعديل منتجات خاصة، خاصة تلك الأمور التي تعود بالأرباح في النهاية.
Microsoft AI CEO Mustafa Suleyman: the social contract for content that is on the open web is that it's "freeware" for training AI models pic.twitter.com/FN1xrqnJC0
— Tsarathustra (@tsarnick) June 26, 2024
هذا لم يمنع العديد من شركات الذكاء الاصطناعي من الادعاء بأن التدريب على المحتوى المحمي بحقوق الطبع والنشر هو “استخدام عادل”، لكن معظمهم لم يكن جريئًا مثل سليمان عند الحديث عن ذلك، رغم أنه ليس مفاجئًا من حيث المنطلق، في ظل الاتهامات الواضحة لشركة مايكروسوفت وOpenAI باستغلال بيانات ومحتوى المستخدمين على الإنترنت لتدريب GPT للذكاء الاصطناعي.