Синтезаторы речи

2020-01-04 в 23:43 (последнее изменение 2021-04-12 в 23:59)

В 1973 году "рулила" интересная книга М.А. Згута "Мой друг магнитофон". Теперь магнитофоны остались друзьями ценителей винтажа, а многие любители что-нибудь послушать обратили внимание на синтезаторы речи.

Это явление - не новое. Программисты проводили такие эксперименты ещё на ламповых ЭВМ. Но домашним пользователям синтезаторы речи стали доступны лишь с распространением одноплатных компьютеров, в частности, ZX Spectrum-совместимых. Так, программа HLAS компании Voicesoft синтезировала речь на чешском языке, и если прислушаться, можно было разобрать произносимые слова. Эта программа, скриншот которой показан далее, состояла из модуля на ассемблере и "фронт-енда" на Бейсике, поэтому, загрузив ассемблерный модуль отдельно, можно было обращаться к нему из любых бейсиковых программ.

Разобравшись в правилах чешского языка, можно было заставлять программу говорить по-русски. Когда-то я пробовал интегрировать этот модуль в свою же программу для игры в морской бой, чтобы сделать её говорящей. Но так её и не доделал. Затем один из квалифицированных программистов портировал эту программу на компьютер "Орион-128", одновременно "обучив" правилам русского языка и расширив возможности. На этой платформе ей стало удобнее пользоваться благодаря квазидиску.

Одновременно с программными появлялись и аппаратные синтезаторы речи. Одно из таких решений предлагала компания TI. Их разработка поддерживала только английский язык. Уже в наши дни применённые в нём алгоритмы сторонние разработчики реализовали заново программно. Так появилась библиотека Talkie для Arduino. Если вы ардуинщик, попробуйте обязательно.

По мере обновления парка компьютеров пользователи познакомились с синтезаторами речи для операционных систем DOS, Windows, Linux и Mac OS. Они оказались значительно удобнее: синтез речи из длинных файлов, более разборчивая речь. В частности, пользовались популярностью разработки Объединённого института проблем информатики Национальной академии наук Беларуси. Они, как и у TI, первоначально были аппаратными, но с переходом на IBM PC их удалось сделать сначала программно-аппаратными, а затем и программными. Были и довольно простые разработки. Так, программа spp.exe, автор которой пожелал остаться неизвестным, запускалась даже на XT и не требовала никакого дополнительного железа, выводя звук через PC Speaker. Но пользователи мечтали о синтезаторах речи на более малогабаритной технике, чем не только стационарный компьютер, но и даже ноутбук. Такое стало возможным с появлением КПК, "читалок" на "электронной бумаге", тифлофлешплееров, смартфонов и планшетов. Последние два вида устройств на сегодня являются наиболее распространёнными, и синтезаторы речи чаще всего запускают именно на них. Послушать любой сайт, как если бы он был подкастом или аудиокнигой - что может быть удобнее? Об этом и поговорим.

В операционной системе Android синтез речи организован так же, как в спектрумовском HLAS'е. Нужны две программы - синтезатор и фронт-енд, взаимодействующие согласно определённому стандарту - любой синтезатор может работать с любым фронт-ендом. Синтезатор может уже входить в состав прошивки смартфона или планшета, а может и быть скачан из Play Маркета. Не возбраняется иметь на одном устройстве и несколько синтезаторов. Все они появляются в меню настроек в одном из подразделов "Специальных возможностей", где их можно выбирать, настраивать, проверять.

Вот перечень некоторых популярных оффлайновых синтезаторов речи для Android. Оффлайновых - значит, синтезирующих речь непосредственно на устройстве, а не на сервере.

Pico TTS. Входит в прошивку ну очень бюджетных устройств с мизерным объёмом встроенной флеш-памяти. Словом, куда более сложные синтезаторы не помещаются. Поддерживает только английский язык, речь неразборчивая.

Модуль преобразования текста в речь Samsung. Поставляется вместе со смартфонами и планшетами догадайтесь какого производителя. Поддерживает русский язык, речь разборчивая, но несколько монотонная. Словарь ударений невелик, если слова в нём нету, синтезатор может поставить ударение неправильно. На том смартфоне, с которого снят приведённый выше скриншот, установлен этот синтезатор.

Синтезатор речи Google. Поддерживает русский язык, речь разборчивая, почти не монотонная. На сегодня наиболее популярный из синтезаторов.

RHVoice. Компактный синтезатор с открытым исходным кодом, поддерживает русский язык. Речь роботоподобная, но разборчивая. У программы есть форк под названием T-800 Mod - у кого-то возникла ассоциация с голосом известного киногероя.

Теперь о фронт-ендах. Их в Маркете много. На следующем скриншоте показан один из них - @Voice Aloud Reader. Это компактное приложение, которое при помощи любого из перечисленных выше синтезаторов озвучивает тексты из файлов форматов TXT, PDF, HTML, а также из буфера обмена. Открываете любую веб-страницу, и можете тут же её послушать вместо чтения - если умеете пользоваться буфером обмена, конечно.

В Android пользоваться синтезатором речи мы научились, перейдём к iOS. Там, в общем-то, то же самое, только названия другие. Не "Специальные возможности", а "Универсальный доступ". Не "Синтез речи" или "Параметры TTS", а "Зрение". Там включаем "Проговаривание". Точно так же, как и в Android, выделяем, например, на веб-странице весь текст, как будто собираемся скопировать его в буфер обмена. Отличия начинаются далее. Фронт-енд не нужен. Вместо "Копировать" выбираем "Произнести" - и слушаем. Узнать, является ли применённый в iOS синтезатор оффлайновым или онлайновым, не удалось.

Вот мы с вами и познакомились с синтезаторами речи, применяемыми на смартфонах и планшетах. Надеюсь, эта информация оказалась для читателей полезной и интересной.

Посмотрите еще эти статьи
Управляем вытяжкой на кухне пультом от телевизора на Arduino
Вывод картинки на дисплей 128x64
Детектор микронаушников
Ethernet shield w5100 таймер включения на веб странице
Вывод различных данных на дисплей LCD 128x64
Подключение датчиков газа и дыма серии MQ к Arduino

Не пропустите обновления! Подписывайтесь на нашу группу Вконтакте.
Так же у нас есть Telegram канал.
Вам понравился наш материал? Поделитесь с коллегами!

Просмотров: 2601. Оценка статьи: 5.0 из 5. Уже оценило 1 читатель

Об авторе - tormozedison

More by tormozedison

Подсветка микроскопа своими руками 2021-09-30 3971	Ремонт клавиши обогрева зеркал Opel Frontera 2018-04-16 5275
YI Ultra Dash Camera 2019-01-17 2879	Зарядное устройство Ресурс-1 2022-01-05 9915
Милицейский проблесковый маяк на Arduino 2015-04-18 8182	Разборка аккумулятора радиостанции Motorola P040 2016-03-07 7155
Индикатор уровня на LM324 и LM358 2012-01-13 40324 4	Arduino светофор 2015-03-17 18037 3
Ремонт электродвигателя 2019-03-07 2903	Усилитель мощности TDA2003 (5Watt) 2011-02-27 6034

Всего комментариев: 0