يوتيوب تطلق ميزة الوصف التلقائي للتأثيرات الصوتية

كشفت منصة يوتيوب التابعة لشركة جوجل الأمريكية عن النظام الجديد الخاص بها للوصف التلقائي للتأثيرات الصوتية، والذي يستطيع تحديد التأثيرات الصوتية الموجودة ضمن مقاطع الفيديو تلقائيا، ووعدت الشركة بدعم المزيد من القدرات عن طريق المراحل المقبلة مع تدريبها لخوارزميات الكشف.

وقد استخدمت يوتيوب حتى الآن منذ عام 2009 الخوارزميات بهدف توضيح الكلام الموجود ضمن الفيديو تلقائيا، وقد تطورت الميزة بمرور الوقت بشكل ملحوظ، وطبقا لمدونة قامت بنشرها الشركة الأمريكية على الموقع خاصتها للمطورين فإن الميزة أصبحت أقرب إلى معدلات الخطأ البشري من أي وقت مضى.

وتعتبر القدرة على توضيح التأثيرات الصوتية مهمة شاقة، وهي مهمة لميزات إمكانية الوصول إلى يوتيوب على الإنترنت، وبحسب مهندسي جوجل فإن هذه المهمة لم يكن سهل تحقيقها إلا من خلال التطوير الذي حدث على مدار العامين الماضيين لتقنيات التعلم الآلي.

ووفقا للشركة فإن المشكلة ليست متعلقة بشكل كبير بإمكانيات الحواسب في معرفة الأشياء وتصنيفها، ولكنها تتعلق بعدم توفر قاعدة بيانات مهمة للمؤثرات الصوتية التي من الممكن أن تستخدم أثناء تدريب الشبكة العصبية القادرة على التحديد والكشف.

وقد قرر الفريق جعل تركيزه بطريقة أولية على الضحك والموسيقى، حيث أنها تضيف معنى هام للحوار المتواجد في الفيديو بالنسبة للمستخدمين الذين لديهم مشكلة الصمم أو صعوبة السمع.

تعليقات
تحميل...