Glas se sve više koristi za interakciju s našim uređajima, uz to što je jedina metoda za one koji trebaju ovu vrstu metoda pristupačnosti. U svakom je slučaju vrlo ugodno govoriti kako bi se diktirao tekst ili jednostavno unijeti glasovne naredbe u naše sustave tako da oni izvršavaju neku vrstu radnje bez upotrebe ruku. Problem je u tome prepoznavanje glasa temelje se na mehanizmima koji koriste matematičke algoritme za prepoznavanje govora i nisu 100% pouzdani.
Tehnološki napredak sve više donosi pouzdanost do savršenstva, a umjetna inteligencija i sustavi velikih podataka također uvelike pomažu u poboljšanju programa prepoznavanja govora. U posljednje vrijeme ulažu se mnogi napori kako bi se ti sustavi maksimalno poboljšali, a mnoga istraživanja se usredotočuju na to kako bi poboljšala kontrolu i učinila ih sučeljem budućnosti. Imajte na umu da su trenutna sučelja manje prirodna za ljude i manje su brza od glasa.
Sustavi za prepoznavanje glasa imat će vrijednost oko 10 milijardi dolara u sljedećim godinama i zato se velike tvrtke usredotočuju na razvoj pomoćnika poput Appleove Siri, Microsoftove Cortane ili Mycroft za Linux, uz to što postaju sve popularniji i češći proizvodi poput Amazon Echo, Google Home ili Apple HomePod za dom, kao i integriranje sofisticiranih sustava za prepoznavanje glasa u povezane automobile.
To je rekao, naš popis alata za prepoznavanje govora za Linux zvuk:
- Julius: moćan je mehanizam za kontinuirano prepoznavanje govora s puno rječnika.
- Duboki govor: je implementacija TensorFLow Baidu-ove DeepSpeech arhitekture.
- Simon: prilično fleksibilan softver za prepoznavanje govora.
- kaldi: je C ++ dizajn alata za istraživanje prepoznavanja govora.
- CMUSfinga: u ovom slučaju to je mehanizam za prepoznavanje glasa za mobilne aplikacije i poslužitelje.
- duboki govor.python: je implementacija DeepSPeech-a s Pythonom i koristeći Baidu Warp-CTC.
Vrlo dobro, i hoće li postojati neki dobar TTS (pretvaranje teksta u govor) za linux?
U sustavima Windows i Android postoje vrlo kvalitetni glasovi kao što su Loquendo, Ivona ili NeoSpeech, ali oni nisu za Linux. Na Linuxu sam isprobao glasove mbrola i picoTTS, ali vrlo su robotski.
Cepstral nudi besplatni glas Alejandra za linux, što je prilično dobro, ali nisam znao kako ga instalirati.
Hodam istim ako dobijete dobar udio
Loquendo možete koristiti s vinom na linuxu. Preporučujem ovaj video ...
https://www.youtube.com/watch?v=OfGxR_O0Vjk
Pokušao sam instalirati pomoćnika, mislim, Google asistenta i nisam uspio, ostao sam u dijelu datoteke registra, mislim da se zove. Šteta što je Alexa sranje ...
Program espeak radi na debian apt install konzoli espeak. I pridružite se na primjer espeak -ves «Hello World»
-ves je v = glasovi su = španjolski
Imate mnogo mogućnosti za čitanje tekstualne datoteke, zapisivanje rezultata u wav datoteku.
pozdravi
istina je vrlo loša, prozori to je drugi svijet ... evo zaostaju 10 godina
I 3 godine kasnije, da! ovo još uvijek kasni.