استفاده از میلیون‌ها ساعت ویدیوی یوتیوب برای آموزش GPT-4

img 1712475537839 510

گوگل اعلام کرد آموزش GPT-4 با استفاده از یک میلیون ساعت ویدیوهای یوتیوب انجام گرفته است. به نظر می‌رسد شرکت OpenAI آموزش GPT-4 را با کمک ویدیوهای یوتیوب انجام داده است. گوگل قصد دارد با اتخاذ تدابیر فنی و قانونی از چنین استفاده‌های غیر مجازی جلوگیری کند.

به گزارش سرویس اخبار فناوری و تکنولوژی تکنا، گزارش منتشر شده توسط نیویورک تایمز نشان می‌دهد مدل صوتی Whisper در OpenAI به این شرکت کمک کرده تا بتواند میلیون ها ساعت از ویدیوهای یوتیوب را رونویسی کرده و از آن برای آموزش GPT-4 پیشرفته‌ترین مدل زبانی بزرگ این شرکت استفاده کند. اگرچه این شرکت جنبه قانونی استفاده از چنین داده‌هایی را می داند. اما معتقد است استفاده از این داده‌ها را باید به صورت منصفانه انجام داد.

شرکت های هوش مصنوعی برای آموزش مدل‌های پیشرفته خود و توسعه آنها به داده‌های بسیاری نیاز دارند. از طرفی بسیاری از آنها در یافتن این داده‌ها و استفاده از آنها برای آموزش با کیفیت با مشکلاتی مواجه شده‌اند. طبق گزارش‌های اخیر این مشکل باعث شده تا بسیاری از این شرکت‌ها به سمت ستفاده از داده‌های شامل قانون کپی رایت هوش مصنوعی بروند. در این بین شرکت OpenAI و ویدیوهای یوتیوب نیز چنین وضعیتی دارند.

پیش از این نیل موهان مدیرعامل یوتیوب هشدارهایی را در مورد احتمال استفاده شرکت OpenAI از ویدیوهای یوتیوب برای آموزش هوش مصنوعی خود از قبیل SORA داده بود. به گفته وی از این پس تدابیر فنی و قانونی توسط گوگل اتخاذ خواهد شد تا مجدداً چنین استفاده‌های غیر مجازی از سوی دیگر شرکت ها صورت نگیرد. به گفته سخنگوی OpenAI آموزش مدل‌های این شرکت با استفاده از مجموعه داده‌های منحصر به فرد نجام می‌شود تا بتوان درک درستی از آنها ایجاد کرد. همچنین این شرکت مدعی است برای آموزش‌ها از منابع متعددی مانند داده‌های دسترسی عمومی و داده‌های غیر عمومی استفاده کرده است.

Adblock test (Why?)

لینک منبع خبر


دیدگاه‌ها

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

این سایت از اکیسمت برای کاهش هرزنامه استفاده می کند. بیاموزید که چگونه اطلاعات دیدگاه های شما پردازش می‌شوند.