Nysse puhuu – maailman ensimmäinen kannettava puhesynteesi tuli Tampereelta

Maailmanlaajuisen puheteknologian, akustiikan ja digitaalisen signaalinkäsittelyn historiassa suomalaisella tutkimuksella on ollut poikkeuksellisen varhainen ja rakenteellisesti merkittävä rooli. Suomessa 1970-luvulla kehitetty Synte 2 edustaa teknologiahistorian käännekohtaa, sillä se oli maailman ensimmäinen mikroprosessoripohjainen, sääntösynteesiin perustuva ja täysin kannettava puhesyntetisaattori, joka kykeni muuttamaan vapaan tekstin ymmärrettäväksi ihmispuheeksi reaaliajassa.

Juttu tiivistettynä

Suomalainen Synte 2 oli maailman ensimmäinen mikroprosessoripohjainen ja täysin kannettava puhesyntetisaattori, joka muutti vapaan suomenkielisen tekstin puheeksi reaaliajassa. Kehitystyötä veivät eteenpäin erityisesti Matti Karjalainen ja Unto Laine.
Taustalla oli Tampereella 1970-luvulla syntynyt ajatus tehdä puhuva apuväline vammaisten ja puhekyvyttömien käyttöön. Suomen kielen säännönmukainen kirjoitus–äänne-suhde ja uusi mikroprosessoritekniikka tekivät ratkaisusta mahdollisen.
Synte 2 esiteltiin kansainvälisesti tieteellisissä yhteyksissä ja se vaikutti myöhempiin suomalaisiin puhesynteesijärjestelmiin. Laitteita ja aineistoa on talletettu Tampereen Vapriikkiin, jossa niitä hyödynnetään teknologian historian tutkimuksessa.

Synte 2-laitteen tausta johtaa avantgarde-musiikkiin

Puhesynteesitutkimuksen varhaisimmat juuret Tampereella juontavat poikkeuksellisesti taiteen ja teknologian rajapintaan vuoteen 1973. Tuolloin tutkijat Matti Karjalainen ja Unto Laine muodostivat ”Electronissimo Avantgardissimo” -nimisen elektroakustis-avantgardistisen duon, jonka puitteissa he tekivät kokeiluja elektronisen musiikin ja äänen synteesin parissa. Nämä taiteelliset ja teknologiset kokeilut ohjasivat tutkijoiden mielenkiinnon inhimillisen äänen sähköiseen mallintamiseen.

Näin keksinnön alkuvaihetta kuvataan duon omilla verkkosivuilla:

”Elokuun loppupuolella 1973 kaksi innokasta, musiikkia harrastavaa, 26- ja 27-vuotiasta diplomi-insinööriä linnoittautuivat Tampereen teknillisen korkeakoulun Pyynikillä olleeseen elektroniikan laitoksen laboratorioon yhdeksi viikonlopuksi. He toivat mukanaan kaksi kelanauhuria ja mikrofoneja, sekä joukon soittimia, akustisen kitaran, sähkökitaran, bongorummut, nokkahuilun ja huuliharpun. Eväinä heillä oli juustonpala, makkaraa, patonkia, ruisleipää, jokunen pullo punaviiniä sekä valtaisa määrä intoa ja päättäväisyyttä: Tänä viikonloppuna katsotaan, mitä käytettävissä olevista laitteista ja paikalla rakennetusta elektroniikasta irtoaa. Nyt annetaan palaa ja ihmetellään sitten myöhemmin, syntyikö mitään kelvollista tai kiintoisaa. Pidetään hauskaa!”

Electronissimo Avantgardissimo -albumin levynkansi.

Näitä äänitteitä ei tuolloin aikanaan julkaistu, mutta ne herättivät kiinnostusta kaverusten työyhteisöissä. Laine työskenteli tuolloin Biotekniikan tutkimuslaitoksella (BTT), jota hallinnoi Tampereelle 1970 perustettu Biotekniikan säätiö. Laitoksella tutkittiin ja kehitettiin sairaala- ja apuvälinetekniikkaa.

Laitoksella oli kehitetty kommunikaation apuvälineitä ja apuvälinetekniikkaan erikoistunut jaosto alkoikin keskuudessaan pohtia, voisiko synteettinen puhe ja puheentunnistus ratkaista tulevaisuudessa monia kommunikaatioon liittyviä ongelmia. Jaostoa veti Pekka Ruotsalainen.

Asiasta päätettiin keskustella myös tutkimuslaitoksen johtajan, professori Boris Segerståhlen kanssa. Kun Boris oli kuunnellut Karjalaisen ja Laineen kokeiluissaan aikaansaamia ääninäytteitä, joissa oli mukana puheen kaltaista ääntelyä, hän totesi:

”Ovathan nämä hauskoja efektejä, mutta voisikohan pojat ihan oikeasti rakentaa pienen, puhuvan koneen? Sellaisen, joka muuttaa sille annetun suomenkielisen tekstin puheeksi. Sitä voitaisiin käyttää esimerkiksi vammaisten apuvälineenä.”

Tuohon aikaan kaikki tunnetut puhesyntetisaattorit eri puolilla maailmaa olivat laboratoriossa seisovia vaatekaapin kokoisia tutkimuslaitteita. Ne olivat toki kuljetettavissa, mutta eivät mukana kannettavia, kuten kaverukset aiheesta vitsailivat.

Heitetty haaste alkoi kiehtoa innokkaita nuoria tutkijoita:

”Se vasta olisi jotain, saada koneet puhumaan!”

Elokuussa 1973 käynnistyi Synte 1 -tutkimuslinja, joka perustui Karjalaisen varhaisiin ideoihin äänen sähköisestä tuottamisesta. Tämä linja osoittautui kuitenkin kunnianhimoisuudestaan huolimatta umpikujaksi. Käytettävissä ollut analogiatekniikka ja varhaiset digitaaliset ratkaisut olivat liian raskaita, ja kehitystyö jumiutui. Tutkijat joutuivat toteamaan metodin liian työlääksi toteuttaa käytännössä.

Kuitenkin tämä epäonnistuminen toimi innoittajana ajattelutavan muutokselle. Tutkijat havaitsivat pian, että heidän ideansa ristesivät maailmalla tuolloin orastavan, digitaaliseen suodatukseen perustuvan puhesynteesin kanssa. Synte 1 hylättiin, ja iteratiivisen insinöörityön tuloksena syntyi aivan uusi arkkitehtuurillinen ratkaisu. Tästä uudesta, suoraan kielelliseen sääntöpohjaisuuteen nojaavasta lähestymistavasta tuli Synte 2:n perusta.

Synte 2:n kehitystyö alkoi 1970-luvun puolivälissä Valtion teknillisen tutkimuskeskuksen (VTT) Sairaalaelektroniikan laboratoriossa Tampereella. Se oli suora vastaus aikakauden lääketieteellisen teknologian ja vammaishuollon tarpeisiin, ja sen ensisijaisena tavoitteena oli luoda kommunikaatioapuväline aistivammaisille ja puhekyvyttömille.

Laitteen ydinrakenne pohjautui suomen kielen fonetiikan poikkeuksellisen korkeaan grafeemi-foneemi-vastaavuuteen. Toisin kuin englannin kielessä, jossa kirjainten ja äänteiden välinen suhde on epäsäännöllinen ja vaatii massiivisia poikkeussanakirjoja, suomen kielen rakenteellinen johdonmukaisuus teki siitä ihanteellisen alustan algoritmipohjaiselle, sääntöperustaiselle äänenmuodostukselle. Tämä kielellinen ominaispiirre yhdistettynä 1970-luvun uuteen mikroprosessoriteknologiaan asetti suomalaiset tutkijat ainutlaatuiseen asemaan globaalissa kilpajuoksussa.

Laitteen kehityksestä vastasi moniammatillinen tutkijaryhmä, johon kuuluivat Matti Karjalainen, Unto Laine, Seppo Lavonen ja Raimo Toivonen. Ryhmän työskentely kytkeytyi Suomen Akatemian rahoittamaan VAMKOM-hankkeeseen (Vammaisten kommunikaatiolaitteet), joka edusti aikanaan poikkeuksellisen visionääristä panostusta soveltavaan lääketieteelliseen tekniikkaan.

Hankkeen puitteissa ratkaistiin lukuisia kriittisiä laitteiston ja muistin rajoitteita. Aikakautena, jolloin digitaalinen äänenkäsittely vaati tyypillisesti kokonaisen huoneen kokoisia minitietokoneita, tutkijaryhmä onnistui tiivistämään sääntösynteesin vaatimat monimutkaiset laskentatoimitukset ja ääniväylämallinnuksen 1,5 kiloa painavaan, taskulaskimen tyyppisellä syöttölaitteella varustettuun salkkuun. Tämä saavutettiin hyödyntämällä aikakautensa edistyksellisintä Motorola 6800 -mikroprosessoriarkkitehtuuria ja Karjalaisen väitöskirjassaan esittelemää hierarkkisen informaation prosessoinnin menetelmää.

Synte 2:n pitkä perintö kuuluu edelleen

Synte 2 ei ainoastaan ratkaissut esteettömyyteen liittyviä kommunikaatiohaasteita, vaan se myös määritti suomalaisen puhesynteesin ajattelutavan vuosikymmeniksi eteenpäin. Sen merkitys ulottuu pitkälle alkuperäisen lääketieteellisen kontekstinsa ulkopuolelle.

Laite toimi teknologisena ja teoreettisena perustana myöhemmille innovaatioille, kuten huomattavasti integroidummalle Synte 3 -laitteistolle ja Raimo Toivosen kehittämälle korkean tason SPL1-puhesynteesikielelle. Tämä ohjelmistollinen evoluutio mahdollisti puheteknologian siirtymisen laitteistokeskeisestä insinöörityöstä kohti lingvististä ja foneettista akateemista tutkimusta, mitä hyödynnettiin Suomen yliopistoissa aina 2000-luvulle saakka.

Laitteen saavuttama kansainvälinen huomio oli poikkeuksellista. Suomalainen puheteknologia esiteltiin laajalle kansainväliselle tiedeyhteisölle huhtikuussa 1980 arvostetussa IEEE ICASSP -konferenssissa (International Conference on Acoustics, Speech, and Signal Processing) Denverissä, Yhdysvalloissa. Tämä esiintyminen avasi portit kansainväliselle tieteelliselle dialogille ja asetti Synte 2:n globaaliksi vertailukohdaksi.

Myöhemmin, kun yhdysvaltalainen Dennis H. Klatt julkaisi vuonna 1987 massiivisen katsausartikkelinsa tekstistä-puheeksi -teknologian historiasta, hän nosti Synte 2:n esiin yhtenä merkittävimmistä ja edullisimmista korkean laadun syntetisaattoreista, vaikka katsaus keskittyikin pääasiassa englanninkieliseen maailmaan.

Kansallisella tasolla Synte 2:n kulttuurihistoriallinen perintö on monitahoinen. Sairaaloissa, kuten Tampereen keskussairaalan kuulokeskuksessa, laite lunasti paikkansa vakavasti otettavana audiometrisenä ja kuntouttavana työkaluna, jonka tuottaman puheen ymmärrettävyys nousi lyhyen totuttelun jälkeen jopa 90 prosenttiin.

Toisaalta laajemmassa yhteiskunnallisessa kontekstissa ”puhuva kone” toimi peilinä ihmisen ja teknologian muuttuvalle suhteelle. Audiovisuaalisen kulttuurin tutkimuksissa on havaittu, kuinka synteettinen ääni aiheutti aluksi outolaakso-ilmiöksi (uncanny valley) kutsuttua vieraantumista.

Konepuheen mekaanisuus oli Synte 2:n aikakaudella radikaali uutuus, ja laite kiehtoi suurta yleisöä. Puhuvia koneita esiteltiin tiedenäyttelyissä, kuten Tiedekeskus Heurekan perustamista edeltäneessä Teknorama-näyttelyssä vuonna 1987. Aikalaiskokemusten mukaan yleisö saattoi viettää teknologian ständeillä pitkiä aikoja pelkästään kuunnellen koneen puhetta:

”Siinä ständillä tuli vietettyä hetki jos toinenkin, kun se puhuva kone oli vaan sit aika kiehtova.”

Nykyään Synte 2:n asema suomalaisen digitaalisen kulttuurin peruskivenä on turvattu. Laitteita ja niihin liittyvää arkistomateriaalia on tallennettu museoiden, kuten Tampereella sijaitsevan museokeskus Vapriikin tekniikan kokoelmiin ja kuva-arkistoihin, joita tutkijat hyödyntävät audiovisuaalisen teknologian historian tutkimuksessa.

Synte 2 oli paljon enemmän kuin pelkkä elektroninen apuväline. Se oli manifestaatio suomalaisesta insinööritaidosta, monitieteisestä yhteistyöstä ja syvällisestä kielellisen rakenteen ymmärryksestä. Laitteen kehitystyö synnytti osaamiskeskittymiä, jotka loivat perustan sille digitaaliselle infrastruktuurille ja puhekäyttöliittymien tutkimukselle, josta suomalaiset yliopistot ja teknologiayritykset nykypäivänäkin tunnetaan.

Lähteet:

Suomen Lääkärilehti, joulukuu 1979. Uusi muunnos, uusia sovellutuksia: Puhesyntetisaattori

Electronissimo Avantgardissimo. Yhtyeen verkkosivusto.

Synte 2 -laitteen kuva Finna-palvelussa.

Synte 2. Kuvaaja: Reetta Tervakangas / Vapriikin kuva-arkisto (CC BY 4.0)

Nysse puhuu – maailman ensimmäinen kannettava puhesynteesi tuli Tampereelta

Synte 2-laitteen tausta johtaa avantgarde-musiikkiin

Synte 2:n pitkä perintö kuuluu edelleen

Kommentit

Vastaa Peruuta vastaus

More posts

Mies, joka yritti automatisoida luovuuden: Raymond Scott ja maailman ensimmäinen tekoälysäveltäjä

Tekoälyn liveääni vai sanelu – kumpaa kannattaa käyttää missäkin tilanteessa?

Miten reaaliaikainen tekoälytulkkaus toimii sote-arjessa käytännössä?

Ääni, joka ei koskaan vaikene: Reidar Wasenius kloonasi äänensä ja tutkii nyt syvempää inhimillisyyttä tekoälyn aikakaudella