Röstigenkänning på frammarsch
February 17, 2009Ända sedan science-fiction-serier som Star Trek har vi velat säga saker som ”Dator, räkna ut pi med samtliga decimaler”. Men trots en snabb teknikutveckling så har röstigenkänning haft det motigt. De flesta av oss har säkert råkat ut för, eller kanske snarare utsatts för, olika företags talsvarstjänster. Dessa system ska hantera hundratals dialekter och personer med ett brett spektrum av frågor och lyckas sällan nå ett fullgott resultat. Men problemet är huvudsakligen inte själva röstigenkänningen, utan i första hand för datorerna att tolka kluriga frågor som ”ja, alltså mitt bredband är ju jättesöligt, kan ni inte skicka nån reparatör att kolla på det?”.
Moderna system för röstigenkänning har i själva verket en mycket hög prestanda. Redan 1998 var jag på studiebesök hos Nuance i Silicon Valley för att studera deras röstigenkänningssystem. Och mycket har hänt sedan dess. Den senaste versionen av Nuances programvara Dragon NaturallySpeaking kan användas såväl som diktafon som för styrning av datorprogram. I oberoende tester når den över 99 procent korrekt inlästa ord, och det utan att datorn på något sätt behöver tränas till en viss persons röst och dialekt. Programmet kan också användas för att effektivt styra olika program. Om man säger ”sök bilder av Britney Spears på Google” så startar en webbläsare och bilder av Britney söks på Google Images. Säger man ”sök kinesiska restauranger i närheten av Kalmar” så visas kinesiska restauranger i Kalmar på Google Maps. Och säger man ”skicka e-mail till Erik Johansson” så öppnar e-postklienten ett tomt e-mail där Erik plockas från adressboken. Och själva meddelandet läses förstås in på liknande vis.
Fast det sista var inte helt korrekt, vi väntar fortfarande på en svensk version. Tills dess får vi söka hamburgerbarer i Kansas…
Taggar: röstigenkänning
Postad i Teknik |

1 Trackback(s)