Většina lidí spojuje zákon o Američanech se zdravotním postižením s fyzickými, infrastrukturními úpravami, které je třeba provést v budovách nebo na jiných místech, ale jak se definice zdravotního postižení rozšiřuje, lidé si uvědomují, že „přístupný“ se vztahuje také na věci, jako jsou webové stránky a rozpoznávání hlasu.
V tomto případě technologický gigant Google vynakládá úsilí na zlepšení softwaru pro rozpoznávání hlasu pomocí projektu Euphonia. Projekt Euphonia je iniciativa k nahrávání hlasových vzorků od dobrovolníků a jejich analýze, aby lidé s ALS, neurologickými poruchami a jinými řečovými obtížemi mohli využívat svá chytrá zařízení s lehkostí „typického“ jedince.
Proč jsem se přihlásil
Ochrnutá levá hlasivka a asymetrický jazyk v důsledku nádoru na mozku vyústily v moji řečovou poruchu Dysarthria. Moje nezřetelná řeč a slabý hlas znesnadňují přátelům a rodině, aby mě pochopili nebo slyšeli-zejména v přeplněném prostoru. Díky tomu jsem se stal hlavním kandidátem na projekt Euphonia, takže jsem se přihlásil, jakmile jsem o tom četl. Při nahrávání ukázek na primitivní web jsem zopakoval 4500 frází z „Jak se dostanu do Mountain View v Kalifornii?“ Do „Přehrávání skladeb od Cardi B“.
Kromě splnění kritérií projektu Euphonia jsem se přihlásil jako dobrovolník, protože jsem byl poprvé uveden do předního programu rozpoznávání hlasu Dragon Naturally Speaking v roce 1997-a to se efektně nepovedlo. Za ta léta jsem vyzkoušel analogické programy v laboratoři Assistive Technology Lab v bostonské dětské nemocnici a také aktualizované verze Drak, a přestože tento software udělal velké pokroky, stále se mi nedaří určit můj hlas.
To je problematické ze dvou důvodů: Jsem spisovatel s nedostatkem jemné motoriky, takže píšu jednou rukou nebo pomalu dvěma, pokud jsem unavený. Se třemi samostatně publikovanými básnickými knihami, monografiemi a sbírkou nepublikovaných spojených příběhů ke svému jménu se otřásám myšlenkou, kolik bych toho dokázal vyprodukovat, kdyby psaní nebylo tak fyzicky náročný úkol.
Dalším důvodem, proč mi subparální rozpoznávání hlasu vytváří překážku, je šíření produktů podporujících hlas v domácnostech a na telefonech. Když použiji svůj příběh, kdybych měl přístup k počítačům a chytrým zařízením tak, jak byly zamýšleny, bylo by mi to poskytnuto více volného času, umožnilo by mi plně plnit úkoly a potenciálně změnit způsob, jakým žiji.
Projekt Euphonia: Jak to funguje?
Jak tedy Euphonia funguje? Po stažení prototypu aplikace s přizpůsobeným modelem rozpoznávání řeči do telefonu jsem umístil telefon vedle notebooku a diktoval do něj; když jsem to udělal, sledoval jsem vše, co jsem řekl, v mém notebooku v mém dokumentu Google. Dělal jsem to několik měsíců, zaznamenával jsem fráze z románu, který jsem psal, a opravil všechny nepřesnosti pro Google pomocí aplikace.
Po několika dalších měsících bez zaznamenávání frází jsem dokončil první návrh románu - 20 000 slov - pomocí aplikace. To neznamená, že je bezchybný; za každou hodinu, kterou píšu, se musím vrátit a hodinu věnovat drobným opravám. Ale nevadí mi to, protože Euphonia je ve fázi beta a místo pomalého vydávání 100 slov denně generuji 500 slov denně.
Pak je tu skutečnost, že Euphonia nebyla navržena pro zpracování textu - je to spíše pro deklarativní příkazy - a můj styl psaní je to, čemu se říká 'kalhotka' (létat u sedla kalhot), takže mám spoustu přestávek protože nevím, jak věta skončí - víte, jako Michael Scott. Když vím, co chci říct, třebaže v textech, e -mailech nebo při poskytování pokynů svému asistentovi, je to zdaleka nejpřesnější rozpoznávání řeči, jaké jsem kdy použil.
Když instituce, jako je Google, dávají při navrhování architektury budoucnosti hlas zdravotně postiženým a nechávají je zůstat samy sebou, místo aby se je pokoušely převést na něco „normálního“, dává mi to naději, že ve věku AI zvítězí humanismus.
Pokud byste chtěli navštívit webovou stránku Project Euphonia nebo máte poruchu řeči a chcete přispět ukázkou hlasu, můžete přejít na tento odkaz: https://sites.research.google/euphonia/about/