Visor - Az Azure hangok bemutatása

 

Visor – Az Azure hangok bemutatása

A jelen dokumentum a Visor című podcastsorozat július 3.i adásában elhangzottak összefoglalóját tartalmazza, amiben a műsorvezető az Azure TTS nevet viselő hangoknak a képernyőolvasó, és a hangoskönyvolvasó szoftverekbe történő integrálásával ismertette meg a hallgatókat.

az Azure TTS a Microsoft Azure felhő alapú platformjának egy olyan szolgáltatása, amely képes írott szöveget természetes hangzású beszéddé alakítani. Ez a szolgáltatás különböző alkalmazásokban használható, például virtuális asszisztensekben, ügyfélszolgálati rendszerekben, oktatási eszközökben, és akadálymentesítési megoldásokban is.

Főbb jellemzői a széleskörű nyelvhasználat, és  hangtámogatás, a természetes hangzású beszéd, a testreszabhatóság, a szövegformázás, és a kiejtés szabályozása, valamint az integráció lehetősége más Azure szolgáltatásokkal.

Legfontosabb előnyei a könnyű használhatóság, a skálázhatóság, és a magas minőségű beszédszintézis.

a szolgáltatás működik Windows 10, 11, és annál régebbi operációs rendszereken is.

Az adás 2. részében a fent említett hangok telepítésének lépései kerültek bemutatásra. A hangokat szükség esetén elkérhetjük a krisztian@alkosoft.hu e-mail címen keresztül.

A beszerzés után a kapott mappát ki kell csomagolnunk, ehhez a Helyi menüben aktiváljuk a Kicsomagolás Azure TTS x64_x86 lehetőséget, és üssünk rá Entert.

Ezt követően lépjünk az általunk kicsomagolt mappába, és válasszuk az Installer.exe opciót. Ha ezt megtesszük, akkor előjön egy párbeszédpanel, ahol meghatározhatjuk a programnak, hogy milyen műveleteket hajtson végre. Ezt követően lépjünk a nyelv választó ablakra, ahol az optimális működés érdekében az English lehetőséget kell választani.

Következő lépésként az Installation status Install gombot kell választanunk. A művelet kisvártatva befejeződik, ekkor üssünk szóközt az Ok gombon állva. Ezután ismét válasszuk az Installation status Install gombot, mivel a program 32, és 64bit-es verzióját is telepítenünk kell a számítógépre, az optimális működés elérése érdekében. Ezt követően újra aktiváljuk az Ok gombot. Ezután a Close lehetőség választásával bezárhatjuk az ablakot.

A műsor következő részében Görcsi Krisztián bemutatta, hogy miként lehet az úgynevezett Azure TTS hangokat adaptálni a különböző képernyőolvasó szoftverekbe.

A Jaws for Windows használata esetén nyissuk meg a beszédszintetizátorok kiválasztására szolgáló párbeszédpanelt, majd válasszuk a Sapi 5x64 lehetőséget. Ezután az Insert + j billentyűkombinációval nyissuk meg a Jaws képernyőolvasó alkalmazás ablakát, majd válasszuk a Hangbeállítása lehetőséget. Ezután aktiváljuk a hangok almenüt, és kutassuk fel az elsődleges nyelv opciót. Ezt, az optimális működés érdekében érdemes magyarra állítani.

Következő lépésként keressük meg a fellelhető hangkarakterek közül a Noémi, vagy a Tamás opciót, és állítsuk be a hangok paramétereit. Ezek közé tartozik többek között a beszédsebesség, és a tempó, végül nyomjunk szóközt az Ok gombra.

Az Azure TTS hangoknak az NVDA nevet viselő képernyőolvasó szoftverbe történő integrálásához nyissuk meg a fent említett alkalmazást, majd a Control + Insert +s billentyűkombinációval nyissuk meg az alapértelmezett beszédszintetizátor kiválasztására szolgáló párbeszédpanelt, és aktiváljuk a microsoft sapi 5 lehetőséget.

Ezután a control + shift + insert gombot nyomjuk le, és tartsuk lenyomva, majd a nyílbillentyűkkel válasszuk ki a Noémi vagy a  Tamás hangok valamelyikét. Ezután a fent említett módszerrel határozzuk meg a hang paramétereit, és aktiváljuk az Ok gombot.

Az Azure hangoknak a Narrátor nevű képernyőolvasó szoftverbe történő integrálásához indítsuk el a fent említett szoftvert, majd a Windows+ u billentyűkombinációval nyissuk meg a Gépház alkalmazást. Ezután lépjünk a Látás csoport Narrátor elemére, és nyomjuk meg a Narrátor Összes beállítása gombot. Ekkor felbukkannak a Narrrátor program testreszabására szolgáló beállítások. Itt a hangkarakter lehetőségen állva válasszuk ki az alkalmazni kívánt karaktert, és aktiváljuk az Ok gombot.

A műsor utolsó részében az Azure TTS hangoknak a hangoskönyvkészítő alkalmazásokba történő integrálása került terítékre.

A Deksz programba való integráláshoz indítsuk el az alkalmazást, majd a Control + Shift +o billentyűparanccsal nyissuk meg a szoftver beállítására szolgáló párbeszédpanelt. Ezután a Control + Tab billentyűkombinációval lépjünk a Beszéd lapfülre, és a tab gombbal keressük meg a Beszédhangok elemet, végül válasszuk ki a Noémi lehetőséget. Ezután adjuk meg a kiválasztott hangok paramétereit, és aktiváljuk az Ok gombot.

A Balabolka nevű programba való integráláshoz nyissuk meg a fent említett szoftvert. Ezután lépjünk a Sapi 5 lapfülre, majd a felajánlott hangkarakterek közül kutassuk fel a Noémi, vagy a Tamás hangok valamelyikét, és nyomjuk meg az Alapértelmezett gombot, végül állítsuk be a hangok paramétereit, majd aktiváljuk az Ok gombot.

A hangosbemutató után Görcsi Krisztián megköszönte mindenkinek a figyelmet, majd lezárta az adást.

Pillmann Tünde

Várgesztes, 2024. július 3.