Как преобразовать текст в речь, используя командную строку?

Как получить речевой вывод из введенного текста с помощью командной строки?

Также есть возможность изменить скорость речи, высоту, громкость и т. Д. с помощью простой команды .

84
задан 09.08.2019, 11:49

8 ответов

В порядке убывания популярность :

  • говорят , преобразовывает текст в слышимую речь с помощью речевого механизма GNUstep.

    sudo apt-get install gnustep-gui-runtime
    say "hello"
    
  • фестиваль Общий многоязычный синтезатор речи.

    sudo apt-get install festival
    echo "hello" | festival --tts
    
  • spd-говорят , отправляет выходной запрос синтеза речи по тексту речевому диспетчеру

    sudo apt-get install speech-dispatcher
    spd-say "hello"
    
  • , espeak является многоязычным синтезатором речи программного обеспечения.

    sudo apt-get install espeak
    espeak "hello"
    
125
ответ дан 07.10.2019, 11:20
  • 1
    spd-say кажется, предварительно установлен в 14,04 и позже: releases.ubuntu.com/trusty/… – Zach Hirsch 28.07.2016, 14:52
  • 2
    Также sudo pip install gTTS, (текст Google к Речи / github.com/pndurette/gTTS ) тогда gtts-cli "hello" -o hello.mp3 можно передать его по каналу к mpg123 - также. gtts-cli "why, hello there" | mpg123 -. – Jonathan Leffler 06.04.2017, 20:31
  • 3
    к сожалению, spd-say, кажется, не в состоянии играть tts одновременно, только один время – Dan Olson 07.07.2017, 18:51
  • 4
    @ElijahLynn doesn' t работа – Community 19.01.2018, 14:49
  • 5
    espeak / spd-say является лучшим для мемов (другие can' t даже произносят слово " meme" правильно). Лучше всего я могу сказать spd-say использование espeak как его бэкенд (речь звучит как то же). – Community 12.08.2018, 02:16

espeak хороший маленький инструмент.

Мне просто нравится играть с ним в командной строке. Вы можете столкнуться с конфликтом с Pulseaudio, поэтому я использую длинную версию, которая сводит на нет необходимость ее правильной настройки.

sudo apt-get install espeak
espeak --stdout "this is a test" | paplay

espeak --help покажет вам варианты калибровки скорости чтения, высоты тона, голоса и т. Д.

Когда вы делаете свои заметки, сохраните их в виде текстового файла и затем:

echo "these are my notes" > text.txt
espeak --stdout -f text.txt > text.wav
paplay text.wav # you should hear "these are my notes"

Затем вы можете поиграть с ffmeg и др., Чтобы сжать это из PCM в нечто более управляемое, например MP3 или OGG. Но это другая история.

18
ответ дан 07.10.2019, 11:20
  • 1
    очень хороший, можно также попробовать Графический интерфейс пользователя к espeak, espeak-gui. – Derek 16.01.2011, 15:15

Мброла не работает с 11.10.

Инструменты SVOX (pico) просты в установке, просты в использовании и обеспечивают хорошее качество голоса в Ubuntu. Установите его:

sudo apt-get install libttspico0 libttspico-utils libttspico-data

Еще проще, вы можете использовать LibreOffice в сочетании с инструментами SVOX (pico), установив расширение «Читать текст» , и вы получите «GUI» для Это превосходное программное обеспечение TTS:

Настройте параметры Расширения чтения текста с помощью Tools - Add-ons - Read selection .... Используйте / usr / bin / python в качестве внешней программы. Выберите параметр командной строки, который включает токен (PICO_READ_TEXT_PY).

6
ответ дан 07.10.2019, 11:20

SVOX pico2wave

это то, что я использую. И это звучит естественно, его легко понять, оно распознает единицы (м, ° C, кг, ...)

Вот мой первый пост на pico2wave

Natural Sounding Текст в речь?

Все, что вам нужно сделать, это:

Зайдите в Ubuntu Software Center и найдите «pico». Вы найдете 4 или 5 записей с "Small Footprint Ling ...". Установите их.

Возможное использование pico2wave описано в моей первой публикации (перейдите по ссылке выше).

Пока

3
ответ дан 07.10.2019, 11:20
  • 1
    я использовал Ваш путь, может Вы говорить мне, как получить naturl сладкую розеточную речь с помощью пути – Archibald 19.06.2015, 16:03

Даже если вы уже приняли ответ, я хотел бы упомянуть festival, что мне тоже очень нравится. Этот пост на форумах Ubuntu содержит много информации о том, как настроить очень хорошие голоса для него.

2
ответ дан 07.10.2019, 11:20

Следующее не является решением FLOSS, но вы можете найти его стоящим. (это решение Wine ),

Я лично очень увлечен TTS, я использую его довольно часто ... например. слушая бессвязный дискурс, который я никогда бы не стал придерживаться иным образом (потому что мне нужно принести еще одну чашку кофе ... :)

Несколько вещей, которые я обнаружил по пути .. или я должен был скажем, вещи, которые я не обнаружил на этом пути ... Скажу прямо: каждая часть голосового программного обеспечения FOSS TTS , которую я пробовал, находится на одном уровне и, следовательно, не подходит для любого полупродолжительного прослушивания ... .

В настоящее время я использую NaturalVoices ATnT. Он доступен только для Windows (может быть, Mac), но в Ubuntu он работает под wine . (Он имеет незначительный глюк, где мне иногда нужно нажимать на панель, когда я отхожу от читатель ... Это небольшая проблема по сравнению с преимуществом, получаемым от качества речи от NatualVoices.

Некоторые другие вещи, которые я нахожу практически необходимыми для полусмысленного опыта прослушивания, являются; ...

  1. Эти программы TTS не являются интеллектуальными (ну, может быть, такими же умными, как молодой бабуин) .. поэтому им нужна всякая помощь, которую они могут получить. И есть одна (и я нашел только одну программу Reader , которая очень помогает в этом .. Приложение называется ReadPlease (2003 Pro) ... Оно позволяло вам специально изменять слова и группы слов так, чтобы они произносились как . хочу их ... Это ни в коем случае не идеально, но для меня это было различием между всем процессом, который можно использовать и не использовать ...

  2. Речь в Natural Voices "хорошо", но это немного скучно Есть и другие хорошие продукты, но они все для Windows, к сожалению) ..
    Иногда это удивительно хорошо .. но, боже, изначально это боль! .. так что # 2 - это * терпение ... и множество обновлений вашего списка "особых слов" ... Под терпением я имею в виду, что вы (я) фактически привыкли к речевым моделям моего конкретного павиана: ) ... и, между прочим, у меня в настоящее время есть около 3000 слов, которые теперь звучат достаточно по-человечески, так что я больше не дрожу, когда слышу их.

    3 .. «Следуй за прыгающим мячом» ... Опять же, потому что голос никогда не так хорош, как реальный оратор, иногда вещи нужно уточнить ... У программы Reader, которую я использую, есть одна особенность, которую я даже смирился с ее неуклюжим интерфейсом .... Is имеет опцию «выбрать читаемое в данный момент» слово. У многих читателей есть такая возможность, но ReadPlease поддерживает текущую строчку. центр экрана. Это неоценимо, чтобы иметь возможность видеть впереди и сзади, чтобы быстро перечитать то, что вы только что пропустили (так что автоматическое центрирование линии тока - это хорошо) ...

Ну, это мой опыт ... Я собираюсь сделать кофе сейчас, и пока я делаю это, я буду слушать это, чтобы увидеть, как оно "читает" ... TTS удивительно хорош для подбирая опечатки (я делаю много опечаток) ...

Если в репозитории Ubuntu появится что-то хорошее, как ATnT NaturalVoices, я прыгну на него.

Вот ссылка на некоторые образцы Natural Voices : Я использую «MIke»

3
ответ дан 07.10.2019, 11:20

Balabolka под Wine прекрасно работает (для меня) с голосами SAPI4 (голоса SAPI5 не обнаружены в моей системе Linux). Он может открывать файлы и начинать чтение.

Вот ссылка на запись Wine в AppDB для Балаболки: https://appdb.winehq.org/objectManager.php?sClass=application&iId=17859

0
ответ дан 07.10.2019, 11:20

От man spd-say:

NAME
       spd-say - send text-to-speech output request to speech-dispatcher

SYNOPSIS
       spd-say [options] "some text"

DESCRIPTION
       spd-say  sends text-to-speech output request to speech-dispatcher process which handles it and ideally outputs the result
       to the audio system.

OPTIONS
       -r, --rate
              Set the rate of the speech (between -100 and +100, default: 0)

       -p, --pitch
              Set the pitch of the speech (between -100 and +100, default: 0)

       -i, --volume
              Set the volume (intensity) of the speech (between -100 and +100, default: 0)

Следовательно можно получить синтез речи по тексту следующей командой:

spd-say "<type text>"

Исключая:

spd-say "Welcome to Ubuntu Linux"

Вы можете также уровень заранее составленной речи, подача, объем и т.д. видит страницу справочника.

14
ответ дан 07.10.2019, 11:20
  • 1
    spd-say -t female2 "text" делает его терпимым – Adrian Föder 05.06.2018, 20:59

Теги

Похожие вопросы