Fra Kinect til InnerEye - Hvordan Microsoft overlaster gaming tech med AI smarts for å diagnostisere kreft
NyheterIngen enkeltteknologi eksisterer i vakuum. Microsofts Kinect kan ha lidd et ubemannet lysbilde i uklarhet etter at den plagerte sammenkoblingen med Xbox One var truet. Men de underliggende prinsippene, teknologien og forskningen som gikk inn i utviklingen, har nå en langt viktigere rolle enn å måle din drunken “Bare dans” opptreden.
Det sparer liv.
Talsmannen på AI-toppmøtet i London diskuterte Microsofts professor Christopher Bishop (Laboratoriesjef for Microsoft Research) og Antonio Criminisi, hovedforsker for InnerEye Assistive AI for Cancer, hvordan hovedrollens spillteknologi sammen med prinsippene for maskinlæring nå er brukes til å diagnostisere kreftformer.
Slå på timer i sekunder
InnerEye Assistive AI for Cancer er et Microsoft-aktivert forskningsprosjekt ved hjelp av bildeanalyse og verktøy for å dramatisk redusere mengden tid det tar å identifisere og diagnostisere kreftceller hos en pasient.
En av de viktigste bruksområdene til teknologien er å undersøke dataene produsert fra en CT-skanning (Computer Tomography). CT-skanninger ser rett vei gjennom kroppsvev og beinemne, noe som resulterer i bilder som tilbyr mange forskjellige lag eller skiver av visninger gjennom hele pasientens kropp. Sammen bygger de et helhetlig bilde av en pasients indre arbeid - men å identifisere hvert organ gjennom hvert minutielt forskjellig lag, og å kunne identifisere uregelmessigheter i dataene, kan ta selv den dyktigste onkologen mange timer. De bruker 3D-modelleringsteknologi til å markere og identifisere sunne organer, skille dem fra eventuelle avvik, men må bygge det bildet piksel med piksel, eller voxel av voxel, før de bestemmer seg for en behandlingsplan.
Men hva tar en onkolog timer å gjøre for hånd, InnerEye kan oppnå (med litt menneskelig hjelp) på omtrent 30 sekunder. Som sådan kan mye mer tid bli gitt til behandlingsplanen for hver enkelt pasient, med solide data (i tilfelle strålebehandling) om hvilke sunne områder av kroppen for å unngå å treffe.
“For å trene programvaren har vi hundrevis av bilder av CT-skanninger fra pasienter, alle anonymiserte og samtykker”, forklarer Criminisi.
“De kommer fra forskjellige regioner i verden, ikke bare i Storbritannia, noe som er viktig for å fange variasjonen i etnisitet, kroppsform og sykdomsstaten. Hvert bilde er bekreftet av en onkolog til å ha, for eksempel tegn på prostatakreft, og vi finjusterer den gjennom segmentering.”
InnerEye's ytelse er imidlertid ikke blottet for innspilling fra en lege. Faktisk er det forbedret av det. Mens InnerEye er utrolig kapabel til å identifisere ulike kroppssoner, er feilmarginen ikke perfekt. En onkolog kan finjustere den resulterende rapporten, og dataene som sendes tilbake til skyen, kan brukes til å finjustere InnerEys algoritmer uansett hvor de er i bruk, i hvilken som helst øvelse hvor som helst rundt om i verden.
“Det er ikke "forsterkende læring", det er en annen type maskinlæring kalt "veiledet læring",” sa Criminisi. Det er en mer tradisjonell type læring som det er raffinert gjennom profesjonell innsats, i dette tilfellet fra en lege.
“Vi kommer aldri til å erstatte leger,” sier Criminisi. “Men dette er et verktøy for å hjelpe dem å gjøre jobben mer effektivt og effektivt.”
Fra spill til medisin
For alle pasienter med interesse for spill, kan de bli overrasket over å høre røttene til programvaren som nå brukes på reisen til utvinning.
“Det bruker den samme teknologien som ble utviklet for spillspill med Xbox,” forklarer Criminisi.
“Hva vi gjør bruker Random Forest, en veldig spesiell type maskinlæringsalgoritme, som interessant kom ut av Microsofts laboratorium for mange år siden og førte til oppfinnelsen av Kinect.
“Den teknologien så på en bruker, ikke en pasient, fra utsiden i, og var i stand til å gjenkjenne bevegelser. Så vi tenkte, la oss slå den på hodet, og bruk den på bilder der du ser på en pasient fra innsiden ut. Det er samme teknologi som utvikler seg over tid.”
Det er ikke bare skanningsteknologiens historie i Kinect som knytter Microsofts AI-ambisjoner tilbake til spill, men også den underliggende chiphardware som utfører beregningsoppgavene. Sin Felt Programmerbare Gate Array (FPGA) silisiumarkitektur er grunnlagt i arbeidet på gaming GPUer.
“En CPU er en ganske generisk prosessor,” forklarer biskop.
“Den har fordelen av å være veldig fleksibel og programmerbar i programvare, men den faktiske arkitekturen er løst. Deretter er det mer spesialisert arkitektur, for eksempel grafiske prosesseringsenheter eller GPUer. De er designet for rask grafikk, først og fremst for spillbransjen. Men det viser seg at de er svært godt egnet for en svært spesifikk type maskinlæring kalt et "dypt neuralt nettverk", som virkelig er den tingen som er underbygget hele spenningen rundt AI.
“GPUer er en veldig spesifikk fast arkitektur, veldig bra å gjøre mye av det samme parallelt. Men de mangler fleksibilitet. En FPGA er litt annerledes - du kan tenke på det som et LEGO sett av porter som kan konfigureres i programvare for å være veldig spesifikk arkitektur. Det vil ikke være like effektivt som en spesialdesignet brikke på en bestemt algoritme, men du kan veldig raskt konfigurere den til å jobbe med noen av en rekke forskjellige algoritmer, eller hvis en ny algoritme kommer med.
“Dette er det som brenner AI-revolusjonen, sammen med en enorm mengde forskning rundt nye maskinlæringsteknikker. Fleksibiliteten betyr at når en ny og forbedret algoritme kommer sammen, kan vi bare omkonfigurere den FPGA-superdatamaskinen for å håndtere den. Vi trenger ikke lenger å utvikle en ny skreddersydd chip. ”
Fremgang mot personvern
Som et eksempel hevder biskop at FPGA-sjetonger kan brukes til å oversette helheten av den episke romanen "Krig og fred" fra russisk til engelsk på den tiden det ville ta deg for å plukke den av bokhyllen din.
“Tenk deg en fremtid hvor vi distribuerer dette verktøyet på sykehus, som vi allerede gjør,” sier Criminisi.
“Som onkolog løser noen feil, eller gjør stilistiske valg, går dataene tilbake til Microsoft Cloud, Azure, og vi bruker den til å omskole algoritmen. Det er kontinuerlig læring. Neste dag, når legen går tilbake til operasjonen, har ytelsen blitt forbedret. Det er der vi vil gå neste gang.”
Men nå dette spennende neste stadiet i hverdagen diagnostiserer vil presentere utfordringer fjernet fra silisium, innrømmer Criminisi.
“En ting er å snakke om teknologien, den andre er å snakke om de juridiske hindringene og personvernhinder. Å aktivere en mekanisme der du kan gjøre kontinuerlig læring, vil være fra et styringsperspektiv mye mer komplisert enn det vi gjør akkurat nå.”
Det kan ikke være en oppstandelse for Kinect, men for å forhindre en potensielt tidlig død i pasientene, kanskje teknologien, gjennom denne utviklingen, endelig har funnet sitt sanne kall.
- Kunne Microsofts Kinect bli gjenfødt som en virtuell virkelighetskontroller?