Hvorfor stemmegjenkjenning er ikke lenger bare en gimmick
Nyheter"Jeg tar det som et godt tegn at trådløst burde ha nådd sin nåværende perfeksjon på en tid da imperiet har vært knyttet til nærmere forening, for det gir oss enorme muligheter for å gjøre den foreningen nærmere." Verden har kommet en veldig lang vei siden kong George V uttalt disse ordene i en mikrofon i den første juleutgaven som ble sendt av BBC i 1932.
I dag, 82 år senere, ville King George uten tvil ha stirret i vantro da jeg spør smarttelefonen for å finne meg et opptak av hans berømte ord via YouTube på internett. Likevel, etter en ydmyk 'felles' oppfatning, mener jeg at talegjenkjenning og dikteringssystemer endelig er blitt gammel.
I relativ betydning - i hvert fall siden den digitale tidsalderens fødsel - stemme diktatapplikasjoner er ingenting spesielt nytt. Det ondskapsrike belgiske selskapet Lernout og Hauspie utviklet talegjenkjenningssystemer tilbake i 1987 og kjøpte diktafon og Dragon Systems ved begynnelsen av tusenåret for å legge vekt på produktbasen.
Selv om selskapet ikke lenger eksisterer, har Microsoft fortsatt å bruke noen av L & Hs talegrensesnitt tech.
En moden teknologi
Imidlertid var mye av de tidlige applikasjonene flakete og upålitelige, og krever at taledatabaser kobles til algoritmer og "trening" basert på noen få hundre eller så brukere som er innmeldt som en del av forsknings- og utviklingsprogrammer.
I dag, med advent av sky og store data, er det en nesten uendelig mengde taledata tilgjengelig fra "ekte" brukere som er koblet til servere som definerer og behandler språk og kompliserte ord uten trening av algoritme eller bruker. Denne havforandringen fremgår av sofistikering av Apples Siri og DragonDictates mobilapp, som selv lærer fra eget ordforråd som det går langs.
Nå kan alle (uten en veldig sterk aksent) få tilgang til gratis, forbrukerbaserte stemmegjenkjenning og dikteringsverktøy pålitelig og uten trening. Videre har datasettet for bruk av taletransformasjon vokst eksponentielt.
Uten tvil har dette paradigmeskiftet i teknologi vendt stemmebaserte systemer fra quirky techno-gimmicks til ekte forretningsmessige verktøy.
Hvorfor? Fordi utviklingsraten har hoppet så fort, hjalp ikke bare store data, men også etterspørselen etter "hyperoppgave" -verktøy som kan holde tritt med forbrukerens krav om umiddelbarhet og for å jobbe mens du er på farten. Det er sikkert raskere enn å skrive på en mobil skjerm, og for de som ikke kan berøre typen, ofte raskere enn å bruke et skrivebordstastatur.
Tekst-til-tale-fremskritt
Det har også vært en kommende alder for tekst-til-tale-applikasjoner. Når det er begrenset til et nisjeverktøy for synshemmede og tilgjengelighetsmarkeder, har revolusjonen i mobile enheter og spesielt bilsystemer resultert i en bredere forbrukernes etterspørsel etter programvare som kan lese tekst uten å høres ut som et fremmed språk.
Faktisk har tekst-til-tale en uventet fordel når det gjelder korrekturlesing. En journalistvenn av meg fortalte meg at, uansett om han skriver for kringkasting eller utskrift, leser han alltid alt han har skrevet ut høyt.
Ikke bare gir det ham en følelse av skrivingen generelt, men det er den beste måten å plukke opp stavefeil som ellers ville bli savnet med lydløs lesning som bruker en annen del av hjernen. Det samme gjelder tekst-til-tale teknologi. Tross alt, hvor ville vi være uten slike litterære klassikere som "The DaVinci Cod" eller Gabriel Garcia Marquez "One Hundred Ears of Solitude"?
For ti år siden var stemme dikteringsprogramvare egentlig bare domenet til sekretærer, advokater, medikere og sporadisk kunnskapsrik leder. I dag er det nesten tatt for gitt og resultatet kan være en dramatisk økning i produktiviteten og et tryggere liv underveis.
Til slutt, hvis du er en av disse skeptikerne, kanskje dårlig traumatisert av innsatsen til bruk, er det tidligere inkarnasjoner av stemme diktering - hvorfor gir du ikke noen av disse nye systemene en tur? Hvorfor ikke prøve Google Nå, Apple Siri eller Nuance Dragon Dictate-appen?
- Dr Peter Chadha er administrerende direktør for Dr Pete Inc og Steegle.com. Han er en IT-konsulent som tilbyr strategiske IT-vurderinger og implementering til global virksomhet. Han tar en pragmatisk tilnærming til forretningsløsninger, men er en teknologisk evangelist.