Questão Natural Sounding Text to Speech?


Eu estou procurando algum fácil de instalar software de texto para fala para o Ubuntu que soa natural. Eu instalei Festival, Gespeaker, etc, mas nada parece muito natural. Tudo muito sintético e difícil de entender.

Alguma recomendação por aí?


77
2017-07-20 17:36


origem


Duplicação possível de Como posso instalar e usar software de conversão de texto em fala? - Organic Addict


Respostas:


SVOX pico2wave

Além das outras respostas:

Um TTS muito minimalista, um som melhor que o do espeak ou mbrola (na minha opinião).

Alguma informação:
https://launchpad.net/ubuntu/precise/+source/svox/

Eu não entendo porque pico2wave é, comparado ao espeak ou mbrola, raramente discutido. É pequeno, mas parece muito bom (natural). Sem modificações, você ouvirá uma voz feminina natural.

E ... comparado ao Mbrola, ele reconhece as Unidades e fala do jeito certo!
Por exemplo:

  • 2 ° C → dois graus
  • 2m → dois metros
  • 2kg → dois quilos

Após a instalação eu uso em um script:

#!/bin/bash
pico2wave -l=de-DE -w=/tmp/test.wav "$1"
aplay /tmp/test.wav
rm /tmp/test.wav

Em seguida, execute-o com o texto desejado:

<scriptname>.sh "hello world"

ou leia o conteúdo de um arquivo inteiro:

<scriptname>.sh "$(cat <filename>)"

Isso é tudo para ter um TTS de trabalho leve e estável no Ubuntu.


49
2017-08-24 15:12



Tanto quanto eu posso ver, ele usa apenas parâmetros cli como entrada. Existe alguma maneira que eu possa pico2wave para ler o texto de um nome de arquivo? - Carlos Eugenio Thompson Pinzón
pico2wave está no pacote libttspico-utils em versões recentes do Ubuntu. @ CarlosEugenioThompsonPinzón cat <filename> | xargs -I foo -0 pico2wave -w blah.wav foo - naught101
@ CarlosEugenioThompsonPinzón pico2wave -w a.wav "$(input.txt)" =). Concorda que esta interface CLI é um projeto ruim: ao contrário da grande maioria dos CLIs, e possível alcançar o Comprimento do arg de OS max CLI. - Ciro Santilli 新疆改造中心 六四事件 法轮功
@Koen eu não sei! :-) Como qualquer outro problema, tente produzir um exemplo mínimo, por ex. usando echo {1..1000} - Ciro Santilli 新疆改造中心 六四事件 法轮功
@ user49557 Não devemos roubar as perguntas dos outros, então talvez você possa criar uma nova pergunta, explicando o que exatamente você instalou e o que deu errado, e então sempre posso tentar ajudá-lo (não há garantias, embora Não sou especialista: - Koen


Acredito que encontrei o melhor software TTS gratuitamente usando uma extensão do Google Chrome chamada "SpeakIt". Isso só funciona no navegador Chrome para mim no Ubuntu. Não funciona com o Chromium por algum motivo. SpeakIt vem com duas vozes femininas que soam muito realistas em comparação com tudo o que existe por aí. Há pelo menos mais quatro extensões de vozes masculinas e femininas listadas no Chrome se você pesquisar na Chrome Web Store usando "TTS" como sua consulta.

https://chrome.google.com/webstore/detail/speakit/pgeolalilifpodheeocdmbhehgnkkbak?utm_source=chrome-ntp-icon

Para uso em um site. você destaca o texto que deseja ler e clica com o botão direito do mouse em "SpeakIt" ou clica no ícone SpeakIt encaixado na barra superior do Chrome.

Os usuários do Firefox também têm duas opções. Dentro dos addons do Firefox, faça uma busca por TTS e você deve encontrar "Click Speak" e também "Text to Voice". As vozes não são tão boas quanto as vozes do Chrome SpeakIt, mas são definitivamente utilizáveis.

A extensão SpeakIt usa a tecnologia iSpeech e, por um preço de US $ 20 por ano, o site pode converter arquivos de texto em áudio MP3. Você pode inserir texto, URLs, feeds RSS, bem como documentos como TXT, DOC e PDF, e enviar para MP3. Você pode fazer podcast, incorporar áudio, etc. Aqui está um link ...

http://www.ispeech.org/free.text.to.speech.tts.software

e uma amostra de seu áudio (não sei quanto tempo o link durará) ...

http://www.ispeech.org/view/681080/4429622


19
2018-01-27 00:11



Infelizmente, nenhuma das opções do navegador funciona para arquivos PDF. Você já se deparou com um que faz? Gostaria de poder selecionar parágrafos para ler de um PDF (ou seja, não ter que colar bits no terminal ou outro) - kungfujam
esta extensão funciona para mim no chromium 50.0.2661.94 usando o Debian 8.4 e é ótimo! Eu gosto especialmente da voz feminina inglesa. minha única reclamação é que ele pausa por muito tempo em vírgulas. - mulllhausen
Muitas vezes, pronuncia mal as palavras e também leva tempo para enviar o texto para um servidor separado, em vez de usar apenas o seu próprio sistema. - Goddard


Google TTS simples

Por causa da falta de uma alternativa melhor eu escrevi um script bash que faz interface com um script de perl por Michal Fapso para fornecer TTS via Google Translate. A partir da descrição do projeto:

A intenção é fornecer uma interface fácil de usar para saída de texto em voz via sistema de síntese de voz do Google. Uma opção de fallback usando pico2wave fornece automaticamente a síntese de TTS, caso não seja encontrada conexão com a Internet.

Tal como está, o wrapper suporta a leitura de arquivos de entrada padrão, texto simples e a seleção X (texto destacado).

As principais características são:

  • TTS on-line via Google translate
  • síntese off-line de TTS via pico2wave
  • suporta uma variedade de diferentes idiomas
  • pode ler da CLI, arquivos de texto e texto realçado
  • suporta a leitura de texto destacado com formatação fixa (por exemplo, arquivos PDF)

Instalação e uso estão documentados no página do projeto.

Eu ficaria feliz se você fizesse uma tentativa. Relatórios de bugs e qualquer outro feedback são bem-vindos!


11
2017-08-23 19:18



Este tem que ser um dos projetos mais legais que eu já vi. Apenas Uau.
Isso não está mais sendo mantido. - Goddard


Eu olhei alto e baixo para texto para fala para o Ubuntu que é de alta qualidade. Não há nenhum. Minhas cordas vocais estão paralisadas, então eu precisava de TTS para adicionar instruções de voz ao meu Vídeos do Ubuntu. Você pode obter o software comercial de texto para fala Linux de alta qualidade aqui: http://wizzardsoftware.com/att_desktop_overview.php  É muito caro. Acabei comprando o Natural Reader for Windows (não funciona no Ubuntu com o Wine) por US $ 40. Talvez mais tarde eu tenha o Linux.

Espero que isso ajude.


8
2017-07-20 17:57



cara, existe e eu estava usando como na semana passada há pelo menos 5 ou 6 e eu não posso para a vida de mim encontrar qualquer um deles agora, tenho que amar nossa comunidade - mchid
Textaloud tem instruções para fazer o seu produto trabalhar com vinho. Vejo nextup.com/forum/viewtopic.php?t=3349   Eu acredito que o cepstral também tem uma porta linux. Eu não consegui pegar meu software favorito balabolka para funcionar. Eu tenho o windows 10 instalado principalmente para processamento de tts. MS David é bom e semelhante ao cepstral david. O anterior é gratuito se você tiver o Windows 10. - Bhikkhu Subhuti


Eu tenho conduzido pesquisas sobre o melhor som e texto facilmente sintonizado para as vozes da fala. Abaixo está uma lista do que eu considero os 5 principais produtos em ordem de qualidade de som. A maioria dos sites associados a esses produtos tem uma demonstração interativa que permitirá que você faça sua própria determinação.

  1. NeoSpeech
  2. iVona
  3. Acapela
  4. Vozes naturais da AT & T
  5. Vozes CereProc

6
2018-04-24 15:35



existem disponíveis para o linux? Acho que não - Mehdi Khademloo


O Pico e o Espeak são divertidos e fáceis de trabalhar, mas não são tão bons assim. As vozes padrão do Festival também não são boas. No entanto, o Festival é uma estrutura de discurso baseada em esquemas, na qual vários pesquisadores criaram vozes de plug-in muito melhores. Você pode facilmente superar a qualidade pico2wave no Ubuntu, porque uma dessas vozes está disponível como um pacote pronto.

Para fazer o festival soar natural, eis o que fazer:

sudo apt-get install festival
sudo apt-get install festvox-us-slt-hts
festival -i
festival> (voice_cmu_us_slt_arctic_hts) 
festival> (SayText "Don't hate me, I'm just doing my job!")

Você pode fazer isso a partir da linha de comando usando -b (ou --batch) e colocando cada comando em aspas simples:

festival -b '(voice_cmu_us_slt_arctic_hts)' \
    '(SayText "The temperature is 22 degrees centigrade and there is a slight breeze from the west.")'

Você pode obter outras vozes muito boas do repositório da Nitech, mas instalá-las é muito complicado, e os caminhos padrão alterados para que as referências de nome de arquivo nos arquivos de esquema agrupados precisem ser editadas manualmente para funcionar no Ubuntu.


6
2018-04-25 19:31



Btw, no Ubuntu 16.04, este pacote parece estar faltando. Você pode baixar e instalar o deb do Debian e ele funcionará bem: packages.debian.org/sid/all/festvox-us-slt-hts/download sudo dpkg -i Transferências / festvox-us-slt-hts_0.2010.10.25-2_all.deb - Jon Watte


Combine ferramentas SVOX (pico) com o LibreOffice:

As ferramentas SVOX (pico) são fáceis de instalar e trazem vozes de boa qualidade no Ubuntu. Instale-o:

sudo apt-get install libttspico0 libttspico-utils libttspico-data

Você pode usar o LibreOffice em combinação com ferramentas SVOX (pico) instalando o Extensão "Read Text" e você obtém um "GUI" para este excelente software TTS:

Configurar as opções da Read Text Extension com Ferramentas - Complementos - Leia a seleção .... Usar / usr / bin / python como o programa externo. Selecione uma opção de linha de comando que inclua o token (PICO_READ_TEXT_PY), você pode querer experimentar alguns deles.

Agora você só tem que selecionar algum texto em LO Writer, Calc, Impress ou Draw e clicar no ícone adicionado como uma barra de ferramentas (um rosto feliz com um balão).


5
2017-12-15 00:48





Acho as vozes da Nitech HTS no festival muito naturais e reconfortantes em relação a qualquer outra voz que ouvi. Veja este link sobre como configurar o Nitech e outros sons com o festival. Eu não encontrei um bom gui que eu possa usar para configurar essas vozes, mas defini-las via festival.scm ainda funciona. Essa postagem é muito antiga e você pode querer encontrar o diretório de instalação real usando comando "localizar festival"


4
2017-11-09 13:56



Parece ser muito bom. Encontrou demos aqui cstr.ed.ac.uk/projects/festival/onlinedemo.html - Iacchus
Sim, as vozes da Nitech estão acima das outras vozes do Festival (exceto as vozes da CMU, que também são muito boas). Pena que elas são difíceis de instalar. Há uma boa voz CMU que tem um pacote padrão no Ubunut, é chamada de cmu_us_slt_arctic_hts e vem no pacote festvox-us-slt-hts. É muito melhor que pico ou pico! - Jon Watte


Aqui está o que eu fiz para ter discurso natural puro para pdf e outros arquivos de texto (outras soluções não são naturais ou são apenas serviços pagos). Este é realmente um trabalho em torno de usar cromo ou cromo, mas funciona rápido e fácil.

  1. Instalar SpeakIt! extensão em seu cromo ou cromo.
  2. Instalar Visualizador de PDF se você estiver usando o chromium (o chrome já tem um visualizador de PDF de graça) e marque as opções "Permitir em modo anônimo" e "Permitir acesso a URLs de arquivo" nas configurações de extensões do chromium.
  3. Arraste e solte seu pdf para o navegador.
  4. Agora, destaque algum texto e clique com o botão direito do mouse e selecione SpeakIt! para que você possa ouvir a conversão de texto em voz natural e pura.

Há também maneiras de abrir outros arquivos como .doc e .txt no chrome e fazer o mesmo. Existem outras extensões para o chrome que visualizam arquivos pdf, verifique se você se encaixa melhor. Além disso, você pode fazer upload de todos os tipos de textos no Google Drive e usar o SpeakIt! ler para você. Outra extensão chamada 'Speak text' funciona da mesma maneira e tem fala natural.


4
2017-12-12 01:54



Você poderia elaborar sobre como fazer o SpeakIt ler arquivos em pdf salvos no Google Drive? - Marco Lackovic


ao procurar um motor melhor tts para usar com o novo firefox 49 modo narrativo eu encontrei pico tts (svox) - meu motor TTS favorito.

sudo apt install espeak libttspico0 libttspico-data libttspico-utils

Como alterar o sistema de mecanismo de síntese de fala padrão?

As pessoas no arch linux me trouxeram para o caminho certo ( https://bbs.archlinux.org/viewtopic.php?id=217411 ):

Descomente o módulo que você gosta e torne-o padrão nas configurações do discador de fala:

#> vim /etc/speech-dispatcher/speechd.conf

[...]
# -----OUTPUT MODULES CONFIGURATION-----
# Each AddModule line loads an output module.
#AddModule "espeak"       "sd_espeak"   "espeak.conf"
AddModule "pico-generic"  "sd_generic"   "pico-generic.conf"

[...]
#DefaultModule espeak
DefaultModule pico-generic

Reinicie o daemon:

#> sudo systemctl restart speech-dispatcher.service

MAS, ao iniciar o firefox novamente, nada acontece. De acordo com o link acima (arch forum post # 10 e # 16) trabalha com festival (não tente), mas o speech-dispatcher para pico não lista as vozes disponíveis. Não vai correr.

Qualquer ideia lá fora seria muito apreciada ;-)


2
2017-11-14 22:55