Den store data boom Hva, hvorfor, og hvordan?
NyheterStore data er et begrep som uendelig bandied rundt IT-sektoren, men i hvilken grad har du virkelig tatt hånd om det? Dybere vår kollektive forståelse av emnet er Dr. Andrew Jennings, sjefsanalysepersonell ved FICO og leder av FICO Labs, i vår spesielle Q & A.
Hva var de viktigste milepæler i historien om prediktiv analyse?
Mange av de tidlige milepælene kom fra militære søknader i 1930- og 1940-tallet. For eksempel utviklet Alan Turing og IJ Good noen banebrydende arbeid på å tildele bevisvekt til bestemte variabler da de var involvert i dekoding av tyske koder i andre verdenskrig.
1950-tallet og 1960-tallet så utviklingen av metodikker for modellering, for eksempel arbeidet gjort av Bill Fair og Earl Isaac på kreditt score.
På slutten av 1990-tallet satte økningen av Internett-søk og -personalisering av eBay, Amazon og Google sikkert scenen for økningen av store data. Du kan se flere milepæler i FICOs siste analytics infographic.
Hva er noen av de vanlige bruken av prediktiv analyse i dag?
Prediktiv analyse er mye brukt i reiselivsnæringen, både for å sette flybaner og billettpriser og for å hjelpe forbrukerne med å finne de beste prisene. I kredittbransjen er det sentralt for både risikovurdering og bedrageringsdeteksjon.
Og selvfølgelig bruker markedsførere i mange bransjer det for å identifisere de beste tilbudene for hver enkelt person.
Store data er utvilsomt et hett tema for øyeblikket, men er det mange selskaper som allerede bruker store datainblikk i deres daglige drift?
Ja, og noen selskaper har hele forretningsmodellen deres basert på analyse av store data. Et eksempel ville være Farecast, et selskap dannet for å hjelpe forbrukerne med å bestemme når man skal kjøpe flybilletter for å få den beste prisen.
Hvordan har fremveksten av store data påvirket bruken av analyse?
Flere bedrifter i dag innser at de ikke kommer til å være konkurransedyktige hvis de ikke kan sette data på jobb.
Mens før, de fleste analysene var hva vi ville kalle forretningsinformasjon, fokusert på rapportering, i dag bedrifter forstår nivået på personalisering som kreves for å konkurrere med online giganter som Amazon er bare mulig hvis du kan forstå kundene dine mye bedre og handle på det innsiktet med mer personlig service.
Dette har drevet en stor økning i etterspørselen etter analytics - analytics software industrien vokste fra 11 milliarder dollar (£ 7,2 milliarder) i 2000 til 35 milliarder dollar (23 milliarder kroner) i 2012.
Hva slags innvirkning vil tekstanalyser ha?
Tekstanalyser og dens motstykke, taleanalyser, vil få en enorm innvirkning. For å kunne bygge prediktive analysemodeller må informasjon oppgis i numerisk form.
Naturlig språkbehandling gjør at tekst og tale kan konverteres til et digitalisert format som kan brukes i modellering. Siden den fleste menneskelige kommunikasjon er språkbasert, vil vi ha et mye større sett med data som skal brukes i modeller, slik at vi virkelig kan knekke nye problemer.
For eksempel analyseres de vilkårene folk bruker når de gjør nettbaserte søk for å identifisere utbrudd av en sykdom i en bestemt region.
Hva betyr å sette analytics i en cloud computing infrastruktur betyr for bransjen?
Skyen senker hindringen for oppføring for analyse. Flere bedrifter enn noen gang vil kunne få tilgang til analyser, uten å måtte bruke mye penger på programvareverktøy og maskinvare.
For det første kan bedrifter "bygge i skyen" ved hjelp av modelleringsverktøy.
For det andre kan bedrifter få tilgang til analytiske tjenester som er forhåndsutviklet for bestemte forretningsproblemer, eller skreddersy analytiske tjenester til virksomheten raskt.
For det tredje, en avansert sky kan sette bedrifter i kontakt med et samfunn av analytiske eksperter. For det fjerde skaper noen skyer en "analytics marketplace" - en apputveksling eller appbutikk for analyser utviklet av tredjeparter.
På den ene siden antas store data å være en løsning på mange presserende økonomiske og samfunnsmessige utfordringer. På den annen side hevder personvernsforesatte at når data er samlet, har vi ingen kontroll over hvem som bruker den eller hvordan den brukes. Hvordan kan organisasjoner overvinne denne negative oppfatningen, og er det slik en stor datakode for etikk?
Det er ingen stor datakode for etikk, men det er absolutt kontroll over hvem som har tilgang til hvilke data, ikke bare personvernregler på nasjonalt nivå, men også på industrinivå.
En persons økonomiske data, som for eksempel dataene som er rapportert til et kredittbureau, har svært strenge regler, for eksempel. Utfordringen er at nye datakilder kommer raskt på nettet, og i enkelte tilfeller kan det forekomme et forsinkelse mellom når data blir tilgjengelige og når forskriftene blir satt på plass.
Det er viktig for enhver bedrift å bruke data for å følge ånden i personvernreglene, og å vurdere om bruken av dem vil skade personvernet.
Er det nok eksperter i analytics for å møte eksplosjonen i forretningsbehov?
Nei, og dette er et problem. Mellom 2011 og 2012 hoppet jobbinnlegg for "datavitenskapere" med 15.000%. Det er et talentgap over hele verden, og folk som har blitt trent i analyse, statistikk og operasjonell forskning er etterspurt.
Dessverre betyr den globale etterspørselen at vi ser en rekke mennesker som erklærer seg analytiske eksperter som ikke er så godt trente som de fagfolk som gjør jobben allerede.
Imidlertid ledes de fleste analytics-selskaper og de fleste analytiske lagene innen bedrifter av analytikere som kan fortelle om en søker har de nødvendige ferdighetene. Den ideelle analytikeren har matematikkferdigheter, tankegangen til en problemløser og gode kommunikasjonsevner.
Det er sikkert noen sterke universiteter over hele Asia som er verdenskjente for deres analyseprogrammer og kandidater, blant annet RenMin University, University of International Business and Economics, Det indiske statistiske instituttet og det indiske institutt for teknologi.
Harvard Business Journal har kalt dataforsker den "sexigste jobben i det 21. århundre", så dette er en utmerket tid til å være analytiker!
- Dr. Andrew Jennings er sjefanalysepersonell ved FICO og leder av FICO Labs. Han blogger på FICO Banking Analytics Blog og FICO Labs Blog.