Przywykliśmy już do tego, że różne urządzenia techniczne przekazują nam informacje głosem. Po prostu mówią do nas! Obecnie nikogo to ani nie dziwi, ani nie zastanawia – przecież systemy elektroniczne ustawicznie karmią nas jakimiś dźwiękami: korzystamy z elektronicznie serwowanej muzyki, słyszymy w telefonie głos rozmówcy, nawet jeśli jest on oddalony o setki kilometrów, GPS głosowo uprzedza o skrzyżowaniach – po prostu rutyna.
Czym innym jest jednak odtworzenie wcześniej zarejestrowanego nagrania, a czym innym jest wygenerowanie głosowego komunikatu na całkowicie nieoczekiwany temat. Jednym z obszarów, w których to bywa niezbędne, jest tzw. tyfloinformatyka – czyli udostępnianie osobom niewidomym (lub słabo widzącym) informacji, które człowiek widzący czyta na ekranie. Tu nie pomoże nagrany głos lektora – tę wypowiedź trzeba wytworzyć. Do tego celu służą specjalne systemy, tzw. syntezatory mowy, o których historii chcę dziś opowiedzieć.
Czytaj więcej
Wiele obiektów na świecie ubiega się o miano najstarszego kalendarza. Obecnie przyjmuje się, że n...
Pierwsze urządzenia mechaniczno-pneumatyczne
Pierwsze urządzenie wytwarzające sygnały na podobnej zasadzie jak w systemie głosowym człowieka zostało zbudowane w 1779 r. przez Christiana Gottlieba Kratzensteina. Było to pięć rezonatorów akustycznych tak skonstruowanych, że kiedy przedmuchiwano przez nie powietrze (z miecha), to wytwarzała się fala dźwiękowa odbierana przez słuchaczy jako samogłoska – odpowiednio (zależnie od tego, który rezonator był przedmuchiwany) słyszane były głoski: a, e, i, o albo u.
Wytwarzanie samogłosek było (i jest do dzisiaj) najłatwiejsze, bo struktura widma sygnału dźwiękowego jest w nich bardzo prosta, a ponadto przez cały czas wygłaszania głoski się nie zmienia. Samogłoska może więc być dowolnie wydłużana lub skracana, z czego korzystają śpiewacy. Natomiast spółgłoski mają bardziej złożone widmo – i co więcej, dźwięk w trakcie wygłaszania jednej spółgłoski może się zasadniczo zmieniać. Rozważmy na przykład głoskę „p”. Jej artykulacji nie da się wydłużyć, a struktura dźwięku jest radykalnie inna na początku wygłaszania głoski i na jej końcu. Stwarzało to budowniczym sztucznych syntezatorów mowy ogromne trudności, lecz kolejny badacz Wolfgang von Kempelen przezwyciężył te ograniczenia. Nie przyszło mu to łatwo, ale przez wiele lat prowadził intensywne badania nad mechanizmem wytwarzania mowy w takcie głosowym człowieka, czyli w obszarze od strun głosowych, poprzez język i podniebienie, aż do warg. W wyniku tych badań w 1791 r. wydał książkę „Mechanizm ludzkiej mowy”, a potem na wystawie w Wiedniu zaprezentował urządzenie, które mogło wytwarzać wszystkie samogłoski i niektóre spółgłoski. Niestety, von Kempelen okrył się złą sławą, gdy usiłował twierdzić, że zdołał zbudować mechanizm zdolny do gry w szachy. Ten jego Mechaniczny Turek zachwycał ludzi od 1769 r. Grał z nim w szachy m.in. Napoleon Bonaparte i współtwórca Stanów Zjednoczonych Benjamin Franklin. Wszyscy chwalili sprawność maszyny i geniusz twórcy.