Hvordan kunstig intelligens kan bidra til å levere bedre søkeresultater / Nyheter

Google har blitt veldig interessert i kunstig intelligens de siste årene, og særlig sine applikasjoner for vanlige folk. For eksempel, at det kjører involverer maskinlæring.

Nå har forskere ved Texas Advanced Computing Center imidlertid vist hvordan kunstig intelligenssteknikker også kan levere bedre resultater på søkemotoren. De har kombinert AI, crowdsourcing og superdatamaskiner for å utvikle et bedre system for utvinning og klassifisering av informasjon.

Ved 2017 års møte for Computational Linguistics Association i Vancouver i denne uken ledet lektor Matthew Lease et lag som presenterte to papirer som beskrev en ny type informasjonsinnhentingssystem.

Intelligente systemer

"En viktig utfordring i naturlig språkbehandling er nøyaktig å finne viktig informasjon i fri tekst, som lar oss trekke den ut i databaser og kombinere den med andre data for å gjøre mer intelligente beslutninger og nye funn," sa Lease..

"Vi har brukt crowdsourcing til å annotere medisinske og nyhetsartikler på skala slik at våre intelligente systemer vil kunne finne mer nøyaktig nøkkelinformasjonen i hver artikkel."

De var i stand til å bruke de menneskelige dataene til å trene et neuralt nettverk for å forutsi navnene på ting, og trekke ut nyttig informasjon fra tekster som ikke er annotert i det hele tatt.

I det andre papiret viste de hvordan man vektet forskjellige språklige ressurser, slik at den automatiske teksten klassifisering er bedre. "Neural network-modeller har tonnevis av parametere og trenger mye data for å passe dem," sa Lease.

Konsekvent bedre resultater

Ved testing på både biomedisinske søk og filmomtaler leverte systemet stadig bedre resultater enn metoder som ikke innebar vekting av dataene.

"Vi hadde denne ideen om at hvis du på en eller annen måte kunne legge grunn til at noen ord er relatert til andre ord a priori, da i stedet for å måtte ha en parameter for hvert enkelt av disse ordene separat, kan du knytte sammen parametrene over flere ord og dermed måten trenger færre data for å lære modellen, sier Lease.

Han la til: "Industri er flott å se på nærtidsemner, men de har ikke samme frihet som akademiske forskere å forfølge forskningsideer som er høyere risiko, men kan være mer transformative på lang sikt."

Kinesisk team bygger verdens største virtuelle univers