Biblioteca Digital do IPG >
Escola Superior de Tecnologia e Gestão (ESTG) >
Relatórios de Estágio >
Licenciaturas >
Relatório Estágio Lic. em Engenharia Informática >
Utilize este identificador para referenciar este registo:
http://hdl.handle.net/10314/9099
|
Título: | Projeto em Contexto de Estágio – TText-to-Speech-Cache de ficheiros de áudio gerados (Altice Labs - Aveiro) |
Autores: | Santos, Filipe |
Palavras Chave: | TTS IVR Hash Table cache |
Data: | Nov-2023 |
Editora: | Escola Superior de Tecnologia e Gestão |
Relatório da Série N.º: | 047.3 SAN |
Resumo: | A Altice Labs tem se focado na criação de uma nova geração de serviços de Interactive Voice Response (IVR), com o uso de inteligência artificial para permitir a adaptação em tempo real das interações com os clientes. Um elemento fundamental desses serviços é a funcionalidade de Text-to-Speech (TTS), que é amplamente usada para fornecer informações em resposta às solicitações dos clientes imitando uma interação humana.
O objetivo deste projeto é resolver os desafios associados ao uso de TTS em tempo real, em comparação com a utilização dos tradicionais anúncios pré-gravados. Os problemas residem no atraso percetível e nos custos associados à síntese em tempo real. Neste projeto foi desenvolvido um componente inovador que minimiza essas desvantagens, através da implementação de uma cache de arquivos de áudio previamente processados.
Com a utilização desta cache, os serviços continuam a solicitar a síntese de texto em tempo real, mas o que é efetivamente reproduzido é um anúncio que foi previamente gerado e guardado na cache como resultado de uma síntese anterior. Esta abordagem proporciona uma resposta mais rápida e eficiente, enquanto, simultaneamente, reduz os custos associados à síntese em tempo real.
No âmbito deste projeto foi implementada uma cache e conduzidas avaliações para analisar os benefícios desta abordagem, incluindo a redução de atrasos e custos operacionais. O trabalho foi desafiador devido à complexidade técnica envolvida na criação da cache de áudio em formato de hash table para os serviços de TTS já existentes. Além disso, foi necessário garantir que a solução fosse robusta e escalável para atender à procura crescente de interações de voz em tempo real. A conclusão bemsucedida deste projeto representará um avanço significativo na capacidade da Altice Labs em fornecer serviços de IVR aprimorados e económicos à empresa. |
URI: | http://hdl.handle.net/10314/9099 |
Aparece nas Colecções: | Relatório Estágio Lic. em Engenharia Informática
|
Ficheiros deste Registo:
Ficheiro |
Descrição |
Tamanho | Formato |
Filipe Santos_1702072.pdf | | 1451Kb | Adobe PDF | Ver/Abrir | |
|
|