DSpace DSpace

Biblioteca Digital do IPG >
Escola Superior de Tecnologia e Gestão (ESTG) >
Relatórios de Estágio >
Licenciaturas >
Relatório Estágio Lic. em Engenharia Informática >

Utilize este identificador para referenciar este registo: http://hdl.handle.net/10314/9099

Título: Projeto em Contexto de Estágio – TText-to-Speech-Cache de ficheiros de áudio gerados (Altice Labs - Aveiro)
Autores: Santos, Filipe
Palavras Chave: TTS
IVR
Hash Table
cache
Data: Nov-2023
Editora: Escola Superior de Tecnologia e Gestão
Relatório da Série N.º: 047.3 SAN
Resumo: A Altice Labs tem se focado na criação de uma nova geração de serviços de Interactive Voice Response (IVR), com o uso de inteligência artificial para permitir a adaptação em tempo real das interações com os clientes. Um elemento fundamental desses serviços é a funcionalidade de Text-to-Speech (TTS), que é amplamente usada para fornecer informações em resposta às solicitações dos clientes imitando uma interação humana. O objetivo deste projeto é resolver os desafios associados ao uso de TTS em tempo real, em comparação com a utilização dos tradicionais anúncios pré-gravados. Os problemas residem no atraso percetível e nos custos associados à síntese em tempo real. Neste projeto foi desenvolvido um componente inovador que minimiza essas desvantagens, através da implementação de uma cache de arquivos de áudio previamente processados. Com a utilização desta cache, os serviços continuam a solicitar a síntese de texto em tempo real, mas o que é efetivamente reproduzido é um anúncio que foi previamente gerado e guardado na cache como resultado de uma síntese anterior. Esta abordagem proporciona uma resposta mais rápida e eficiente, enquanto, simultaneamente, reduz os custos associados à síntese em tempo real. No âmbito deste projeto foi implementada uma cache e conduzidas avaliações para analisar os benefícios desta abordagem, incluindo a redução de atrasos e custos operacionais. O trabalho foi desafiador devido à complexidade técnica envolvida na criação da cache de áudio em formato de hash table para os serviços de TTS já existentes. Além disso, foi necessário garantir que a solução fosse robusta e escalável para atender à procura crescente de interações de voz em tempo real. A conclusão bemsucedida deste projeto representará um avanço significativo na capacidade da Altice Labs em fornecer serviços de IVR aprimorados e económicos à empresa.
URI: http://hdl.handle.net/10314/9099
Aparece nas Colecções:Relatório Estágio Lic. em Engenharia Informática

Ficheiros deste Registo:

Ficheiro Descrição TamanhoFormato
Filipe Santos_1702072.pdf1451KbAdobe PDFVer/Abrir
Sugerir este item a um colega