В порядке убывания популярность :
говорят , преобразовывает текст в слышимую речь с помощью речевого механизма GNUstep.
sudo apt-get install gnustep-gui-runtime
say "hello"
фестиваль Общий многоязычный синтезатор речи.
sudo apt-get install festival
echo "hello" | festival --tts
spd-говорят , отправляет выходной запрос синтеза речи по тексту речевому диспетчеру
sudo apt-get install speech-dispatcher
spd-say "hello"
, espeak является многоязычным синтезатором речи программного обеспечения.
sudo apt-get install espeak
espeak "hello"
espeak
хороший маленький инструмент.
Мне просто нравится играть с ним в командной строке. Вы можете столкнуться с конфликтом с Pulseaudio, поэтому я использую длинную версию, которая сводит на нет необходимость ее правильной настройки.
sudo apt-get install espeak
espeak --stdout "this is a test" | paplay
espeak --help
покажет вам варианты калибровки скорости чтения, высоты тона, голоса и т. Д.
Когда вы делаете свои заметки, сохраните их в виде текстового файла и затем:
echo "these are my notes" > text.txt
espeak --stdout -f text.txt > text.wav
paplay text.wav # you should hear "these are my notes"
Затем вы можете поиграть с ffmeg и др., Чтобы сжать это из PCM в нечто более управляемое, например MP3 или OGG. Но это другая история.
Мброла не работает с 11.10.
Инструменты SVOX (pico) просты в установке, просты в использовании и обеспечивают хорошее качество голоса в Ubuntu. Установите его:
sudo apt-get install libttspico0 libttspico-utils libttspico-data
Еще проще, вы можете использовать LibreOffice в сочетании с инструментами SVOX (pico), установив расширение «Читать текст» , и вы получите «GUI» для Это превосходное программное обеспечение TTS:
Настройте параметры Расширения чтения текста с помощью Tools - Add-ons - Read selection .... Используйте / usr / bin / python в качестве внешней программы. Выберите параметр командной строки, который включает токен (PICO_READ_TEXT_PY).
SVOX pico2wave
это то, что я использую. И это звучит естественно, его легко понять, оно распознает единицы (м, ° C, кг, ...)
Вот мой первый пост на pico2wave
Natural Sounding Текст в речь?
Все, что вам нужно сделать, это:
Зайдите в Ubuntu Software Center и найдите «pico». Вы найдете 4 или 5 записей с "Small Footprint Ling ...". Установите их.
Возможное использование pico2wave описано в моей первой публикации (перейдите по ссылке выше).
Пока
Даже если вы уже приняли ответ, я хотел бы упомянуть festival
, что мне тоже очень нравится. Этот пост на форумах Ubuntu содержит много информации о том, как настроить очень хорошие голоса для него.
Следующее не является решением FLOSS, но вы можете найти его стоящим. (это решение Wine ),
Я лично очень увлечен TTS, я использую его довольно часто ... например. слушая бессвязный дискурс, который я никогда бы не стал придерживаться иным образом (потому что мне нужно принести еще одну чашку кофе ... :)
Несколько вещей, которые я обнаружил по пути .. или я должен был скажем, вещи, которые я не обнаружил на этом пути ... Скажу прямо: каждая часть голосового программного обеспечения FOSS TTS , которую я пробовал, находится на одном уровне и, следовательно, не подходит для любого полупродолжительного прослушивания ... .
В настоящее время я использую NaturalVoices ATnT. Он доступен только для Windows (может быть, Mac), но в Ubuntu он работает под wine
. (Он имеет незначительный глюк, где мне иногда нужно нажимать на панель, когда я отхожу от читатель ... Это небольшая проблема по сравнению с преимуществом, получаемым от качества речи от NatualVoices.
Некоторые другие вещи, которые я нахожу практически необходимыми для полусмысленного опыта прослушивания, являются; ...
Эти программы TTS не являются интеллектуальными (ну, может быть, такими же умными, как молодой бабуин) .. поэтому им нужна всякая помощь, которую они могут получить. И есть одна (и я нашел только одну программу Reader , которая очень помогает в этом .. Приложение называется ReadPlease (2003 Pro)
... Оно позволяло вам специально изменять слова и группы слов так, чтобы они произносились как . хочу их ... Это ни в коем случае не идеально, но для меня это было различием между всем процессом, который можно использовать и не использовать ...
Речь в Natural Voices "хорошо", но это немного скучно Есть и другие хорошие продукты, но они все для Windows, к сожалению) ..
Иногда это удивительно хорошо .. но, боже, изначально это боль! .. так что # 2 - это * терпение ... и множество обновлений вашего списка "особых слов" ... Под терпением я имею в виду, что вы (я) фактически привыкли к речевым моделям моего конкретного павиана: ) ... и, между прочим, у меня в настоящее время есть около 3000 слов, которые теперь звучат достаточно по-человечески, так что я больше не дрожу, когда слышу их.
3 .. «Следуй за прыгающим мячом» ... Опять же, потому что голос никогда не так хорош, как реальный оратор, иногда вещи нужно уточнить ... У программы Reader, которую я использую, есть одна особенность, которую я даже смирился с ее неуклюжим интерфейсом .... Is имеет опцию «выбрать читаемое в данный момент» слово. У многих читателей есть такая возможность, но ReadPlease поддерживает текущую строчку. центр экрана. Это неоценимо, чтобы иметь возможность видеть впереди и сзади, чтобы быстро перечитать то, что вы только что пропустили (так что автоматическое центрирование линии тока - это хорошо) ...
Ну, это мой опыт ... Я собираюсь сделать кофе сейчас, и пока я делаю это, я буду слушать это, чтобы увидеть, как оно "читает" ... TTS удивительно хорош для подбирая опечатки (я делаю много опечаток) ...
Если в репозитории Ubuntu появится что-то хорошее, как ATnT NaturalVoices, я прыгну на него.
Вот ссылка на некоторые образцы Natural Voices : Я использую «MIke»
Balabolka под Wine прекрасно работает (для меня) с голосами SAPI4 (голоса SAPI5 не обнаружены в моей системе Linux). Он может открывать файлы и начинать чтение.
Вот ссылка на запись Wine в AppDB для Балаболки: https://appdb.winehq.org/objectManager.php?sClass=application&iId=17859
От man spd-say
:
NAME spd-say - send text-to-speech output request to speech-dispatcher SYNOPSIS spd-say [options] "some text" DESCRIPTION spd-say sends text-to-speech output request to speech-dispatcher process which handles it and ideally outputs the result to the audio system. OPTIONS -r, --rate Set the rate of the speech (between -100 and +100, default: 0) -p, --pitch Set the pitch of the speech (between -100 and +100, default: 0) -i, --volume Set the volume (intensity) of the speech (between -100 and +100, default: 0)
Следовательно можно получить синтез речи по тексту следующей командой:
spd-say "<type text>"
Исключая:
spd-say "Welcome to Ubuntu Linux"
Вы можете также уровень заранее составленной речи, подача, объем и т.д. видит страницу справочника.
spd-say
кажется, предварительно установлен в 14,04 и позже: releases.ubuntu.com/trusty/… – Zach Hirsch 28.07.2016, 14:52sudo pip install gTTS
, (текст Google к Речи / github.com/pndurette/gTTS ) тогдаgtts-cli "hello" -o hello.mp3
можно передать его по каналу кmpg123 -
также.gtts-cli "why, hello there" | mpg123 -
. – Jonathan Leffler 06.04.2017, 20:31spd-say
, кажется, не в состоянии играть tts одновременно, только один время – Dan Olson 07.07.2017, 18:51espeak
/spd-say
является лучшим для мемов (другие can' t даже произносят слово " meme" правильно). Лучше всего я могу сказатьspd-say
использованиеespeak
как его бэкенд (речь звучит как то же). – Community 12.08.2018, 02:16