Včeraj me je na Facebooku Matjaž Intihar (njegovi spletni strani sta recimo Fotografija in potovanja in eFotografija) prosil, če lahko s pomočjo slovenske sinteze govora eBralec pripravim zvočni posnetek kratkega besedila. Gre za naslednje besedilo, ki je nastalo s pomočjo umetne inteligence, zato se v vsebino ne bom spuščal:
Geysir na Islandiji je čarobna geotermalna lokacija v regiji Haukadalur, znana po izjemnih izbruhih vode in pare. Najbolj priljubljen gejzir v tem območju je Strokkur, ki redno izbruhne v zrak, ustvarjajoč osupljiv spektakel za obiskovalce. Strokkur je znan po svoji zanesljivosti, saj vodo izstreli vsakih nekaj minut, kar omogoča nepozabno doživetje edinstvene geotermalne aktivnosti.

eBralec med slovenskimi sintezami slovi po tem, da najbolje uporablja različne naglase, sledi jezikovnim pravilom in lahko kombinira tudi tuja lastna imena, ki se pogosto pojavljajo v besedilih.
Omogoča tudi prilagajanje, vendar nastavitev nisem spreminjal, saj je možnosti res veliko. eBralec namreč podpira oznake, ki so določene v Microsoftovi XML SAPI5 dokumentaciji.
Primer odlomka iz pravljice Rdeča kapica, ki uporablja različne kombinacije glasov, lahko poslušate tukaj (YouTube). Če pa vas pot zanese na ljubljansko glavno avtobusno postajo, pa lahko slišite avtomatizirane napovedi odhodov avtobusov, ki jih bere eBralec. Napovedi so občutno boljše od tistih na Slovenskih železnicah, kjer so naglasi povsem zgrešeni.

Skratka, na voljo imam več glasov, uporabil pa sem glasove Maja, Nadja in Renato, ki so se mi zdeli najboljši za zgornji vzorec besedila.

1. Maja

2. Nadja

3. Renato

Kateri se vam zdi najboljši? Meni je najbolj všeč Maja. Govorim seveda o glasu, da ne bo pomote 🙂

Leave a Reply