O YouTube introduziu uma nova ferramenta para ajudar os criadores de vídeo a traduzir automaticamente seus vídeos para diferentes idiomas. Essa ferramenta usa AI, que significa inteligência artificial, para fazer a tradução. O anúncio foi feito através do YouTube em uma conferência chamada VidCon, informou o TechCrunch. O YouTube fez parceria com uma empresa chamada Aloud, que também usa IA para dublar vídeos. A Aloud faz parte da incubadora interna do Google chamada Area 120.
No início deste ano, o YouTube adicionou um recurso que permite aos criadores criar várias faixas de áudio em diferentes idiomas. Isso significa que os criadores podem sincronizar seus vídeos para que as pessoas que falam outros idiomas possam entendê-los. Em junho de 2023, os YouTubers já dublaram mais de 10.000 vídeos em mais de 70 idiomas.
Antes dessa nova ferramenta, os criadores tinham que trabalhar com outras empresas que fornecem serviços de sincronização. Isso pode levar muito tempo e dinheiro. No entanto, com o Aloud, os YouTubers agora podem sincronizar seus vídeos gratuitamente.
Aloud foi desenvolvido pelo Google em 2022. Ele usa IA para transcrever um vídeo, traduzi-lo e criar uma versão dublada. Os criadores podem revisar e editar a transcrição antes da sincronização do Aloud.
O YouTube está testando essa ferramenta com centenas de criadores. O vice-presidente de produtos para criadores do YouTube, Amjad Hanif, mencionou isso ao público na conferência. Hanif também disse que o YouTube em breve disponibilizará essa ferramenta para todos os YouTubers. Atualmente, o Aloud está disponível apenas em inglês, espanhol e português. Mas no futuro haverá outras línguas, como o hindi e o bahasa indonésio.
Hanif também mencionou que o YouTube está trabalhando para fazer com que as faixas de áudio traduzidas soem como a voz do criador. Você deseja que a versão dublada tenha a mesma expressão e movimentos labiais do original. O YouTube confirmou ao TechCrunch que planeja usar IA generativa para adicionar mais recursos ao Aloud, como preservar a voz do criador, melhorar a transmissão de emoções e reanimar os movimentos dos lábios.
“Organizador sutilmente encantador. Ninja de TV freelancer. Leitor incurável. Empreendedor. Entusiasta de comida. Encrenqueiro incondicional.”