Danish Centre for Design Research
ENGLISHDANSKKONTAKTSITEMAPRSSRSS

Data for alle på nettet

- datavisualisering fremmer brugen af forskningsdata


Send artikel
Print/pdf Abonnér Facebook

Fortalere for Open Access argumenterer for, at videnskabens resultater skal være tilgængelige for alle. Nu vil skaberen af world wide web, Tim Berners-Lee, gå skridtet videre og gøre alle verdens data tilgængelige på nettet. Videnskabsministeriet i Danmark har allerede sat initiativ om datadeling i gang og udbredelsen af datadeling kan understøttes af datavisualisering, fremhæver designforsker, ph.d.-studerende Pia Pedersen fra Designskolen Kolding.

Af Jeppe Morgenthaler

Manden der opfandt world wide web, Tim Berners-Lee, har netop været i Danmark for at modtage UNESCOs Niels Bohr Guldmedalje til fremtrædende fysikere for sin udvikling af html og world wide web. Han og organisationen W3C (World Wide Web Consortium), som han er direktør for, er store fortalere for udbredelse af datadeling via nettet.

Datadeling på den internationale dagsorden

På den internationale TED-konference (Technology, Entertainment, Design) i februar 2010 i Long Beach, Californien, præsenterede Tim Berners-Lee nogle af de første resultater af datadeling med konkrete eksempler på, hvordan ny viden kan dannes på baggrund af allerede eksisterende data. TED er en nonprofit-organisation, dedikeret arbejdet med at fremme gode ideer inden for teknologi, underholdning og design.

Sir Tim Berners-Lee
Tim Berners-Lee opfandt world wide web. Han er i dag direktør for organisationen for W3C (World Wide Web Consortium) og er stor fortaler for udbredelse af datadeling via nettet.
Foto: Le Fevre Communications

Datavisualisering giver dybere indsigt

Professor i international sundhed ved Karolinska Institutet i Stockholm, svenskeren Hans Rosling, er et eksempel på en internationalt anerkendt forsker, der allerede genbruger og deler data med andre. Hans organisation Gapminder har udviklet et stykke software kaldet Trendalyzer, som grafisk kan visualisere kvantitative data som andet og mere end kolonner og rækker af tal.
“Datavisualisering kan afsløre og vise informationer, som ikke kan ses i den rå data alene,” siger ph.d.-studerende Pia Pedersen, der forsker i datavisualisering ved Institut for Kommunikations design på Designskolen Kolding. Hun har studeret historisk datavisualisering fra franske hulemalerier til Hans Roslings Trendalyzer-software og hun oplever grafisk datavisualisering som et designfelt i rivende udvikling. Hun peger på, at vi i disse år ser en opblomstring af teknologier, der udvider mulighederne for grafisk formidling af statistiske data, med Hans Rosling som en af frontfigurerne.
”Indgående viden om de data, der visualiseres, er afgørende for datavisualisering. Hans Roslings Trendalyzer-software formår at ramme balancen mellem datamængde og grafisk udtryk og har været med til at nedbryde fordomme omkring visualisering og deling af data for mine designstuderende,” siger Pia Pedersen.

Datadeling allerede på dagsordenen i Danmark

Tankerne bag Tim Berners-Lees ønske om at revolutionere og promovere genbrug af data er implementeret af både Det Hvide Hus, Verdensbanken og en række europæiske lande, herunder Tyskland, England og Danmark. Videnskabsministeriet har med initiativet ODIS, Offentlige Data i Spil, sat datadeling på dagsordenen med udgangspunkt i data produceret for skatteydernes penge. Ifølge Center for Digitalisering, som er en del af IT- og Telestyrelsen under videnskabsministeriet, er planen, at store mængder data skal være offentligt tilgængelige gennem et system kaldet datakildekataloget, så entreprenører, iværksættere, forskere og borgere i almindelighed kan bruge disse data til at generere ny viden.

ODIS er en del af en større satsning i forlængelse af Center for Digitaliserings arbejde for, at data kan overføres mellem offentlige it-systemer, at leverandøruafhængighed fremmes, og at offentlige digitale løsninger samtidig skaber grundlag for innovation og kreativitet i den private og offentlige sektor. Med en relancering af datakildekataloget vil det nu blive endnu nemmere at dele data.

Linked Open Data datasæt 
The Linked Open Data Cloud er en sky (cloud) af data der er gjort tilgængelig for alle i verden efter de foreskrifter og standarder Tim Berners-Lee og W3C har formuleret. Skyen rummer allerede mange milliarder datasæt, der alle er samlet i større eller mindre klynger. Disse klynger linker i mange tilfælde til hinanden indbyrdes. Det største og mest centrale datasæt er DBpedia, som indeholder datasæt fra Wikipedia, den brugergenerede onlineencyklopædi.
Illustration: Linking Open Data cloud diagram, af Richard Cyganiak og Anja Jentzsch www.lod-cloud.net

Forskere opfordres til at dele data

Center for Digitalisering opfordrer direkte forskere til at dele de bagvedliggende data der danner grundlag for deres forsknings- publikationer.

Kommunikationsmedarbejder Cathrine Lippert og souschef Janus Sandsgaard arbejder begge med ODIS-kampagnen på Center for Digitalisering. Cathrine Lippert fremhæver, at et af delmålene med ODIS er at skabe bevidsthed om de muligheder, der ligger i at genanvende offentlige data i nye sammenhænge og nedbryde fordomme om, hvor besværligt og dyrt det er. Disse mål ligger tæt op ad W3Cs formuleringer om mulighederne i datadeling.
”Den akademiske tradition er baseret på, at man bygger oven på hinandens arbejde og orienterer sig i, hvad andre har tænkt – og for designforskningen kan det være en god anledning til at vise, at man kan producere viden, der kan anvendes mere end en gang” siger Cathrine Lippert.
”Vi foreslår i virkeligheden, at forskerne skal gøre det på den måde der er mindst bøvlet for dem” siger Janus Sandsgaard og peger på, at datastandarder ikke bør sætte en kæp i hjulet for dem, der vil dele deres data. Således kan alle data som udgangspunkt bruges – også kvalitative data, så længe der er påhæftet metadata, der kan karakterisere og kategorisere de kvalitative data.

Ændret holdning til datavisualisering

Hvor der før blandt statistikere kunne være en faglig afstandtagen til designeres grafiske datavisualisering, ser Pia Pedersen i dag en tydelig holdningsændring i det forhold. Hun har selv samarbejdet med Danmarks Statistik og fundet, at statistikere i dag ser grafisk datavisualisering som et vigtigt redskab til datadeling. En holdningsændring som Janus Sandsgaard kan bekræfte.
”Det handler i høj grad om, at mange har taget ja-hatten på,” siger han og understreger at Center for Digitalisering allerede ser en voksende gruppe af såkaldte datagenbrugere i Danmark, både virksomheder og privatpersoner.
”Iværksættere kan i mange tilfælde styrke deres forretning ved at få adgang til offentlige data. Det samme gælder nysgerrige og kreative borgere, men også etablerede virksomheder, der arbejder med data og datavisualisering” siger Cathrine Lippert.

Vækstmuligheder for designforskere og designere

Pia Pedersen ser selv frem til at forske videre i balancen mellem datamængde og grafisk udtryk. Hun mener, at designforskningen kan drage nytte af at positionere sig selv som videnskabende forskningsfelt i forbindelse med datavisualisering og datagenbrug. Og at der eksempelvis for interaktions designere og grafiske designere i de kommende år vil være store vækstmuligheder inden for udvikling og implementering af nye metoder for datavisualisering og videndeling.

Hans Rosling – Trendalyzer

Professor i global folkesundhed Hans Rosling, Sverige, talte til det amerikanske udenrigsministerium i juni 2009 om en central problematik i diskrepansen mellem dataset og mindset hos beslutningstagere. Ifølge Pia Pedersen har Hans Roslings Trendalyzersoftware været med til at bane vejen for anerkendelse af mulighederne i datavisualisering.

Se video med Hans Rosling. Videokilde: www.ted.com

Tim Berners-Lee

Sir Tim Berners-Lee er en engelsk fysiker med en fortid i det europæiske center for forskning i partikelfysik, CERN. For ca. 20 år siden formulerede han datastrukturen i html-sproget og lagde således grundstenen til world wide web som vi kender det i dag. Han er direktør for W3C, det internationale konsortium der regulerer udviklingen af protokolstandarder til world wide web. Standarderne er baseret på afgiftsfri teknologier, så alle mennesker principielt kan bruge dem. Konsortiet er støttet af blandt andre EU-kommisionen og en lang række organisationer, universiteter og virksomheder.

Tim Bernes-Lees tale på TED-konferencen i februar 2010 i Long Beach, Californien.

Datakildekataloget

Datakildekataloget er en oversigt over alle tilgængelige offentlige danske datakilder som den enkelte borger frit kan benytte. Kataloget er oprettet af Center for Digitalisering som et led i kampagnen Offentlige Data i Spil og skal løbende udbygges med flere offentlige datasæt, så snart de bliver tilgængelige. For hver enkelt datakilde vises blandt andet, i hvilket format data findes, hvor data findes, og hvilken myndighed eller institution som er ansvarlig for data. Det er også muligt for borgere selv at bidrage med datakilder. Datakildekataloget er placeret på Digitalisér.dk, som er Danmarks officielle sociale netværk og værktøj til udvikling, deling og diskussion af digitaliseringen af Danmark.

Denne artikel er den tredje i artikelserien om Open Access. De øvrige artikler er:

Illustration øverst: Jonathan Harris og Sep Kamvar / www.weefeelfine.org
Mind Design #32, 2010


E-mail