Hantera information med data science

Har du någon gång funderat över hur Facebook kan förutspå dina framtida kontakter? Eller hur Google kan veta vilken väg du bör ta till jobbet beroende på vilken tid du åker? Det här är bara två exempel på hur företag idag kan utnyttja stora mängder data för att på ett smart sätt underlätta vardagen för sina kunder. Men det är långt ifrån alla företag som vet hur man bäst bör tackla all den data som dagligen flödar in. Det är här data science kommer in i bilden.

I takt med att vår tillvaro blir alltmer digitaliserad samlas allt större mängder data in från exempelvis mobiltelefoner, IoT-sensorer, kameror, och hemsidor på internet. Många företag befinner sig idag i en fas där de bygger infrastruktur för att kunna hantera och spara undan all data som flödar in [1]. Nästa naturliga steg blir att de börjar fundera över hur de ska utnyttja data till att bättre förstå sina affärer och för att hitta fördelar gentemot konkurrenterna. Då är det inte konstigt att många till en början känner sig överväldigade av störtfloden med ny information, och det talas ofta om hur vi drunknar i data, men är svältfödda på faktisk kunskap.

Vad finns det då för hjälpmedel för företag som vill ta sig ur denna malström av data? Räddningen stavas data science, vilket är disciplinen som skaffar överblick och kontroll över data. Människor som jobbar inom området innehar ofta titeln data scientist. En duktig data scientist blandar kunskaper inom matematik/statistik och programmering med ren branschkunskap för att hitta mönster och avvikelser i data. Detta leder fram till nya affärsmöjligheter och insikter som kan skapa värde för såväl företag som samhället i stort.

“Vad finns det då för hjälpmedel för företag som vill ta sig ur denna malström av data? Räddningen stavas data science”

Data scientist har kallats för 2000-talets sexigaste yrke [2] och många attraheras till branschen av möjligheterna att tillämpa heta tekniker såsom machine learning och artificiell intelligens, som båda är nära förknippade med data science. Visst finns det alla möjligheter till detta, men sanningen är att data science är så mycket mer än så. För att ens kunna tillämpa exempelvis machine learning är det viktigt att först [3]:

  • Städa upp data så att den antar lämplig struktur
  • Identifiera frågor som man vill att data ska besvara
  • Modifiera de variabler man har i data eller skapa helt nya
  • Utforska data för att skapa sig förståelse för den, exempelvis med hjälp av diagram

Det är inte sällan det är dessa uppgifter som är de mest tidskrävande för en data scientist.

Sen spelar det ingen roll hur skicklig man som data scientist är på att bearbeta data och applicera machine learning om de som fattar besluten i ens företag inte lyssnar. Som data scientist behöver man således också vara en god kommunikatör för att skapa förståelse för sina upptäckter. Samtidigt är det inte en enkelriktad väg. En studie från 2011 [4] visade ett tydligt positivt samband mellan företags förmåga att fatta beslut baserade på data – så kallat datadrivet beslutsfattande – och hur väl de presterade på marknaden [5]. Det är således minst lika viktigt att ett företags beslutsfattare förstår vilken roll deras data scientist-team spelar [1]. Annars riskerar de kort och gott att fatta felaktiga beslut som inte är grundade i data utan kanske snarare i ren intuition.

Men, kanske du tänker, är data scientist verkligen ett framtidsyrke? Riskerar de inte att ersätta sig själva med den artificiella intelligens de skapar? Svaret är nej. Artificiell intelligens har visserligen blivit ett modeord som man ser överallt idag, men det ska man inte tolka som att maskinerna har blivit redo att tänka själva. Man måste komma ihåg att artificiell intelligens som beter sig mänskligt ligger långt fram i tiden, och att maskiner och datorer i grund och botten är dumma [6]. Man kan visserligen lära dem att bli ohyggligt skickliga på exempelvis: bildigenkänning, aktiehandel, spamfiltrering, och att förutsäga när elektriska komponenter behöver bytas ut. Men, så fort man rör sig bort från deras tilltänkta tillämpningsområden så är det uppenbart att deras kunnande är väldigt begränsat. Med andra ord är de väldigt bra på att hitta svar och fatta korrekta beslut i väldigt specifika fall, men än så länge är de i det närmaste värdelösa när det kommer till att ställa rätt frågor och att generalisera sin kunskap [6]. Därför behövs det en data scientist som kan ställa frågor, analysera, modellera, och dra slutsatser av data. Data science är således inte bara är en tillfällig fluga, utan en bransch som är här för att stanna.

 

Skribent

Olof Rännbäck-Garpinger är konsult på Knightec och har en doktorexamen i reglerteknik från Lunds universitet. Han har lång erfarenhet av att jobba med dataanalys åt Svensk Kärnbränslehantering AB och har varit aktiv inom Data Science-området sedan 2016.

 

[1] Provost, F., & Fawcett, T. (2013). Data science and its relationship to big data and data-driven decision making. Big data1(1), 70-76.

[2] Davenport, T. H., & Patil, D. J. (2012). Data Scientist: The Sexiest Job of the 21st century. Harvard business review90(10), 60-68.

[3] Wickham, H., & Grolemund, G. (2016). R for data science: import, tidy, transform, visualize, and model data. “O’Reilly Media, Inc.”.

[4] Brynjolfsson, Erik and Hitt, Lorin M. and Kim, Heekyung Hellen. (2011). Strength in Numbers: How Does Data-Driven Decisionmaking Affect Firm Performance? Available at SSRN: https://ssrn.com/abstract=1819486 or http://dx.doi.org/10.2139/ssrn.1819486

[5] McAfee, A., Brynjolfsson, E., Davenport, T. H., Patil, D. J., & Barton, D. (2012). Big data: the management revolution. Harvard business review90(10), 60-68.

[6] Brynjolfsson, E., & Mcafee, A. (2017). The business of artificial intelligence. Harvard Business Review.