Um novo equipamento de clonagem de voz de uma empresa britânica afirma que uma variedade de pronúncia do Reino Unido será capaz de reproduzir com mais precisão em comparação com seus rivais dos EUA e da China.
Como os produtos de IA para treinar com voz, a maioria dos dados usados nos dados tradicionais vem da América do Norte ou das fontes de língua inglesa do sul, muitas vozes artificiais parecem semelhantes.
Para lutar contra, a empresa passou um ano para compilar o próprio banco de dados do Reino Unido com sotaques regionais, gravando pessoas no Synthesia Studios e coletando material on -line.
Ele os usou para treinar um produto chamado Express-Voyes, que poderia clonar a voz de uma verdadeira pessoa ou criar voz sintética.
Eles podem ser usados em conteúdo, como treinamento de vídeos, assistência de vendas e apresentações.
A empresa diz que seus clientes desejam uma apresentação regional mais precisa.
“Se você é o CEO de uma organização, ou se é apenas uma pessoa comum, quando mantém sua própria duplicação, deseja salvar seu sotaque”, disse Yusuf Alam Mejjit, chefe da pesquisa da Synthesia.
Ele também acrescentou que os clientes de língua francesa também comentaram que a voz francesa sintética soou mais do que francesa-canadense do que a França.
“Isso ocorre apenas porque esses modelos estão tornando as empresas inclinadas para as empresas norte -americanas e há um conjunto de dados entre eles que são tendenciosos para a população em que estão”, disse ele.
A pronúncia mais difícil em duplicata é a menos comum, disse Majjatti, porque o modelo de IA tem menos material registrado para o treinamento.
Há também relatos de que alto-falantes inteligentes, como produtos de IA promovidos por voz, têm maior probabilidade de lutar para entender diferentes sotaques.
No ano passado, West Midlands expressou preocupação com os documentos internos da polícia Os sistemas de reconhecimento de voz podem entender se os sotaques de Brommy entendem.
Significar Como relatórios da Bloomberg Em março
A empresa diz que o colarinho pretende reduzir a “discriminação de pronúncia” experimentada pelos trabalhadores quando eles não conseguem entendê -los.
Há uma preocupação de que idiomas e dialetos sejam perdidos na era digital.
“Cerca de metade dos sete mil idiomas existentes foram ameaçados de acordo com a UNESCO hoje; cerca de um terço da presença on -line é suportado; menos de 2 % suportado pelo Google Tradlation; e, de acordo com o próprio experimento da OpenAI, apenas cinquenta, ou 0,2 % é apoiado por 80 % de precisão por 80 % da precisão”.
“Os modelos de idiomas são discursos homogêneos”, concorda o especialista em IA Henry Azad, que aconselha agências governamentais e de tecnologia, incluindo a Syntesia.
No entanto, quanto melhor esses produtos serão, eles serão mais eficazes nas mãos dos golpistas.
O produto da sintetização não será livre após a publicação das próximas semanas e manterá o ambiente de discursos nojentos e elementos óbvios.
No entanto, já existem muitos equipamentos gratuitos de lança de voz abertos que são facilmente acessíveis e menos protegidos.
No início de julho, as mensagens produzidas por uma voz de IA foram enviadas aos ministros, disfarçando o secretário de Estado dos EUA, Marco Rubio.
Azder acrescentou: “O cenário de código aberto para a voz se desenvolveu tão rápido nos últimos nove a 12 meses”.
“E é, do ponto de vista da proteção, uma preocupação real”.