الارشيف / تكنولوجيا

ChatGPT يستغل فيديوهات يوتيوب لتعزيز قدراته

دبي - ورده حسن - كشف تقرير جديد عن الطريقة التي اعتمدت عليها شركة OpenAI المطورة لبرامج الذكاء الاصطناعي التوليدي المتقدمة والمعروفة إعلاميًا بـ ChatGPT وهو البرنامج الذي يعتمد على أدوات للذكاء الاصطناعي مثل GPT-3.5 والأكثر تطورًا GPT-4.

كانت شركات الذكاء الاصطناعي كانت تواجه حائطًا عندما يتعلق الأمر بجمع بيانات تدريب عالية الجودة لتطوير أدواتها، وكان ذلك محل قلق في الفترة الأخيرة بسبب الجودة التي أصبحت هذه الأدوات القيام بها، والتي تحتاج إلى قاعدة بيانات ضخمة للغاية، ومن غير المستغرب أن يتضمن ذلك القيام بأشياء تقع ضمن المنطقة الرمادية الضبابية لقانون حقوق الطبع والنشر للذكاء الاصطناعي.

ووفقًا لتقرير لصحية نيويورك تايمز، فمن بين الشركات المهتم بتطوير أدوات الذكاء الاصطناعي التوليدي المتقدمة، قامت شركة OpenAI بتحليل مليارات البيانات المتاحة على الإنترنت عبر المواقع الالكترونية وملفات الأبحاث، وبالإضافة إلى ذلك طورت أداة خاصة بها تدعى Whisper قادر على استخراج المعلومات من المواد الصوتية.

وأكدت الصحيفة أن أداة Whisper قامت بالوصول وتحليل أكثر من مليون ساعة من الفيديوهات المنشورة على يوتيوب واستخراج البيانات منها لتدريب نموذج GPT-4 المتقدم، وأن الأداة تواصل العمل على مدار الساعة عبر خوادم خاصة بالشركة لجميع البيانات والمعلومات.

ووفقًا للصحيفة نفسها، فإن الشركة كانت تعلم أن هذا أمر مشكوك فيه من الناحية القانونية ولكنها تعتقد أنه استخدام عادل، وأشارت نيويورك تايمز إلى أن رئيس OpenAI، جريج بروكمان، شارك شخصيًا في جمع مقاطع الفيديو التي تم استخدامها لتدريب أحدث نموذج ذكاء اصطناعي بالشركة.

من جانبه، أكد متحدث باسم جوجل أن ما قامت به OpenAI في حالة تأكيده، هو انتهاك لسياستها الخاصة بمنصة يوتيوب التابعة لها.

وأضاف مات براينت، لموقع The Verge إن الشركة تابعت التقارير عن نشاط OpenAI لتدريب GPT-4 ولكنها “غير مؤكدة”، مؤكدًا أن شروط يوتيوب الخاصة تحظر النسخ غير المصرح به أو تنزيل المحتوى، مرددًا شروط الشركة الخاصة.

وقال براينت إن جوجل تتخذ “إجراءات فنية وقانونية” لمنع مثل هذا الاستخدام غير المصرح به.

في تقرير صحيفة التايمز، ذكر أن الإدارة القانونية في جوجل طلبت من فريق الخصوصية بالشركة تعديل لغة سياستها لتوسيع ما يمكنها فعله ببيانات المستخدمين، سواء على يوتيوب أو خدماتها الأخرى المتنوعة مثل أدواتها المكتبية بما في ذلك محرر المستندات الخاص بها.

Advertisements

قد تقرأ أيضا