»
Добавить статью

Синтезаторы речи

2020-01-04 в 23:43

В 1973 году "рулила" интересная книга М.А. Згута "Мой друг магнитофон". Теперь магнитофоны остались друзьями ценителей винтажа, а многие любители что-нибудь послушать обратили внимание на синтезаторы речи.

Это явление - не новое. Программисты проводили такие эксперименты ещё на ламповых ЭВМ. Но домашним пользователям синтезаторы речи стали доступны лишь с распространением одноплатных компьютеров, в частности, ZX Spectrum-совместимых. Так, программа HLAS компании Voicesoft синтезировала речь на чешском языке, и если прислушаться, можно было разобрать произносимые слова. Эта программа, скриншот которой показан далее, состояла из модуля на ассемблере и "фронт-енда" на Бейсике, поэтому, загрузив ассемблерный модуль отдельно, можно было обращаться к нему из любых бейсиковых программ.



Разобравшись в правилах чешского языка, можно было заставлять программу говорить по-русски. Когда-то я пробовал интегрировать этот модуль в свою же программу для игры в морской бой, чтобы сделать её говорящей. Но так её и не доделал. Затем один из квалифицированных программистов портировал эту программу на компьютер "Орион-128", одновременно "обучив" правилам русского языка и расширив возможности. На этой платформе ей стало удобнее пользоваться благодаря квазидиску.


Одновременно с программными появлялись и аппаратные синтезаторы речи. Одно из таких решений предлагала компания TI. Их разработка поддерживала только английский язык. Уже в наши дни применённые в нём алгоритмы сторонние разработчики реализовали заново программно. Так появилась библиотека Talkie для Arduino. Если вы ардуинщик, попробуйте обязательно.

По мере обновления парка компьютеров пользователи познакомились с синтезаторами речи для операционных систем DOS, Windows, Linux и Mac OS. Они оказались значительно удобнее: синтез речи из длинных файлов, более разборчивая речь. В частности, пользовались популярностью разработки Объединённого института проблем информатики Национальной академии наук Беларуси. Они, как и у TI, первоначально были аппаратными, но с переходом на IBM PC их удалось сделать сначала программно-аппаратными, а затем и программными. Были и довольно простые разработки. Так, программа spp.exe, автор которой пожелал остаться неизвестным, запускалась даже на XT и не требовала никакого дополнительного железа, выводя звук через PC Speaker. Но пользователи мечтали о синтезаторах речи на более малогабаритной технике, чем не только стационарный компьютер, но и даже ноутбук. Такое стало возможным с появлением КПК, "читалок" на "электронной бумаге", тифлофлешплееров, смартфонов и планшетов. Последние два вида устройств на сегодня являются наиболее распространёнными, и синтезаторы речи чаще всего запускают именно на них. Послушать любой сайт, как если бы он был подкастом или аудиокнигой - что может быть удобнее? Об этом и поговорим.

В операционной системе Android синтез речи организован так же, как в спектрумовском HLAS'е. Нужны две программы - синтезатор и фронт-енд, взаимодействующие согласно определённому стандарту - любой синтезатор может работать с любым фронт-ендом. Синтезатор может уже входить в состав прошивки смартфона или планшета, а может и быть скачан из Play Маркета. Не возбраняется иметь на одном устройстве и несколько синтезаторов. Все они появляются в меню настроек в одном из подразделов "Специальных возможностей", где их можно выбирать, настраивать, проверять.



Вот перечень некоторых популярных оффлайновых синтезаторов речи для Android. Оффлайновых - значит, синтезирующих речь непосредственно на устройстве, а не на сервере.

Pico TTS. Входит в прошивку ну очень бюджетных устройств с мизерным объёмом встроенной флеш-памяти. Словом, куда более сложные синтезаторы не помещаются. Поддерживает только английский язык, речь неразборчивая.

 


Модуль преобразования текста в речь Samsung. Поставляется вместе со смартфонами и планшетами догадайтесь какого производителя. Поддерживает русский язык, речь разборчивая, но несколько монотонная. Словарь ударений невелик, если слова в нём нету, синтезатор может поставить ударение неправильно. На том смартфоне, с которого снят приведённый выше скриншот, установлен этот синтезатор.

Синтезатор речи Google. Поддерживает русский язык, речь разборчивая, почти не монотонная. На сегодня наиболее популярный из синтезаторов.

RHVoice. Компактный синтезатор с открытым исходным кодом, поддерживает русский язык. Речь роботоподобная, но разборчивая. У программы есть форк под названием T-800 Mod - у кого-то возникла ассоциация с голосом известного киногероя.

Теперь о фронт-ендах. Их в Маркете много. На следующем скриншоте показан один из них - @Voice Aloud Reader. Это компактное приложение, которое при помощи любого из перечисленных выше синтезаторов озвучивает тексты из файлов форматов TXT, PDF, HTML, а также из буфера обмена. Открываете любую веб-страницу, и можете тут же её послушать вместо чтения - если умеете пользоваться буфером обмена, конечно.



В Android пользоваться синтезатором речи мы научились, перейдём к iOS. Там, в общем-то, то же самое, только названия другие. Не "Специальные возможности", а "Универсальный доступ". Не "Синтез речи" или "Параметры TTS", а "Зрение". Там включаем "Проговаривание". Точно так же, как и в Android, выделяем, например, на веб-странице весь текст, как будто собираемся скопировать его в буфер обмена. Отличия начинаются далее. Фронт-енд не нужен. Вместо "Копировать" выбираем "Произнести" - и слушаем. Узнать, является ли применённый в iOS синтезатор оффлайновым или онлайновым, не удалось.

Вот мы с вами и познакомились с синтезаторами речи, применяемыми на смартфонах и планшетах. Надеюсь, эта информация оказалась для читателей полезной и интересной.


Не пропустите обновления! Подписывайтесь на нашу группу Вконтакте и страницу в Twitter!
Так же у нас есть Telegram канал.
Вам понравился наш материал? Поделитесь с друзьями!

Оценка статьи: 0.0 из 5. Уже оценило 0 читателей



Вам может быть это интересно

Всего комментариев: 0
Добавить комментарий
Все смайлы