• Nenhum resultado encontrado

2. Pojęciowe i teoretyczne ramy analizy

2.1 Dane cyfrowe

2.1.3 Zróżnicowanie danych

(2013) – […] każde kliknięcie, każdy ruch może się potencjalnie liczyć dla czegoś, kogoś, gdzieś, w jakiś sposób (s. 2).

Dane powstają na dwa sposoby. Po pierwsze, cyfrowe technologie mogą same wytwarzać dane lub gromadzić dane wytwarzane przez człowieka (np. przy pomocy różnego typu czujników lub mediów społecznościowych). Po drugie, narzędzia te służą do digitalizowania danych istniejących do tej pory jedynie w formie analogowej i przetwarzania ich na cyfrowe formaty (Kitchin, 2014a; Kitchin, 2014 za: Nost, Goldstein, 2021). Z tych wytworzonych i zdigitalizowanych danych mogą z kolei powstawać informacje, które z kolei przekładają się na wiedzę posiadaną przez instytucje publiczne i prywatne (Haskel, Westlake, 2018; Kitchin, Lauriault, 2018 za: Nost, Goldstein, 2021; Stephens-Davidowitz 2017). Jak obrazowo tłumaczą Gitelman i Jackson (2013), powołując się na slogan reklamowy technologicznej korporacji IBM, Nasze dane nie tylko mówią nam co dzieje się na świecie, one w rzeczywistości mówią nam dokąd zmierza świat (s. 1). Dane jednak nie są zawieszone w próżni, lecz wytwarzane przy pomocy określonych infrastruktur. Infrastruktury te wiążą się z określonym czasem, miejscem, sposobami finansowania czy wykorzystywanymi technologiami i standardami. Służąc w ten sposób do gromadzenia danych i ich analizowania mogą być wykorzystywane do zarządzania społeczeństwami (Nost, Goldstein, 2021).

in., 2015). To wykorzystanie potencjału danych jest jednak uwarunkowane kilkoma elementami, wśród których za kluczowe można uznać:

a. kwestie technologiczne – np. wypracowywanie standardów przechowywania, udostępniania i wykorzystywania danych oraz standardów chroniących prywatność jednostki;

b. odpowiednią organizację oraz zaplanowanie procesów wykorzystywania danych – kluczowa jest w tym przypadku współpraca pomiędzy zaangażowanymi interesariuszami: podmiotami państwowymi, biznesowymi i światem akademickim.

Znaczenie mają również przejrzystość ram prawnych, dostępność funduszy oraz wypracowanie umiejętności niezbędnych do wdrażania rozwiązań z zakresu datafikacji;

c. postawy wobec wykorzystywania potencjału danych – w tym obszarze znaczenie ma budowanie i promowanie kultury eksplotowania danych oraz podejmowanie inicjatyw umożliwiających dzielenie się i udostępnianie danych (Deetjen i in., 2015).

Niezależnie jednak od powyższych uwarunkowań, cel wykorzystywania danych definiują ich cechy charakterystyczne. Dane wykorzystywane do celów publicznych można charakteryzować na dwa sposoby. Po pierwsze, można je postrzegać przez pryzmat wartości ekonomicznej, która może być w oparciu o nie wytworzona. Po drugie, można je analizować z perspektywy informacji, które można dzięki nim pozyskać. Informacje zawarte w danych przekładają się bowiem na wartość tych ostatnich (Coyle i in., 2020). Obie te perspektywy czyli wartości ekonomicznej oraz informacji przedstawiono w tabeli poniżej. Coyle i in.

(2020) charakteryzują w ten sposób dane zwracając uwagę m.in. na ich nierywalizujący charakter, potencjalne zyski z inwestycji czy koszty (perspektywa ekonomiczna) oraz użyteczność danych, ich jakość, wrażliwość i interoperacyjność (perspektywa potencjalnie pozyskiwanych informacji). Każdy z tych elementów scharakteryzowano w tabeli poniżej.

Tab. 2 Postrzeganie danych z perspektywy wartości ekonomicznej, którą można dzięki nim pozyskać. Opracowanie na podstawie Coyle i in. (2020)

Element charakteryzujący Opis Nierywalizujący (ang. non-rival)

charakter danych (s. 4)

Dane są dobrem, które – w zależności od technicznych i prawnych ograniczeń – może być wykorzystywane przez więcej niż jeden podmiot.

Łączenie dostępnych baz danych z elementami zewnętrznymi (ang. externalities) (s. 5)

Wiedza gromadzona przy pomocy danych może być wynikiem połączenia niewykorzystywanych dotychczas jednocześnie baz. W konsekwencji – jeśli dane zostaną połączone z dodatkowymi, zewnętrznymi bazami – ich wartość może wzrosnąć.

Zyski lub straty z inwestycji w

dane (ang.

increasing/deminishing returns) (s. 6)

Kontekst, sposoby użycia i czas gromadzenia danych wpływają na ich wartość, która – w zależności od powyższych czynników – może maleć lub wzrastać.

Wartość możliwości (ang. option value) (s. 6) dostępnych przy pomocy gromadzonych danych

Sformułowanie nowych pytań badawczych lub poszerzenie możliwości technologicznych może przełożyć się na wytworzenie dodatkowej wartości ze zgromadzonych danych.

Koszty związane z

gromadzeniem

i wykorzystywaniem danych

W zależności od etapu pracy dane wymagają nakładów kosztów o zróżnicowanej wysokości. Koszty ponoszone na początku (ang. up-front cost) związane z inwestycjami w infrastrukturę czy ukształtowanie sposobów działania z danymi przewyższają koszty krańcowe (ang. marginal cost) ponoszone w związku z rozbudowywaniem dotychczas istniejących rozwiązań (s. 6)

Dodatkowe inwestycje Wykorzystywanie danych może wymagać uwzględnienia dodatkowych kosztów przeznaczonych na rozwijanie umiejętności (ang. capabilities) niezbędnych do pracy z danymi oraz inwestycji w infrastrukturę (ang. complementary investment) (s.

7)

Tab. 3 Postrzeganie danych przez pryzmat informacji, które można dzięki nim pozyskać.

Opracowanie na podstawie Coyle i in. (2020)

Czynnik Opis

Użyteczność danych W zależności od podmiotów (np. jednostek, instytucji, warunków klimatycznych czy obiektów), na temat których są gromadzone, dane mogą mieć różną użyteczność. Zróżnicowane mogą być także konsekwencje ich wykorzystywania (np. rozbudowa infrastruktury i posiadanych narzędzi, poprawa jakości życia czy kondycji środowiska naturalnego).

Uniwersalność danych (ang.

generality) (s. 8)

Dane rozróżnia spektrum ich zastosowań. Tym samym dane mogą znaleźć zastosowanie w bardzo wąsko

sprecyzowanych kontekstach

(np. wyspecjalizowane dane medyczne) lub – wręcz

przeciwnie – być wykorzystywane do różnych, niezależnych od siebie procesów analitycznych (np. dane geoprzestrzenne). Możliwości wykorzystywania danych będą ograniczone przez:

● obszar, na którym dane były zbierane;

● czas, w którym gromadzono dane;

● cele, do których realizacji mają być wykorzystane dane np. predykcje lub zrozumienie przeszłych zjawisk.

Jakość danych (ang. quality) (s.

10)

Jakość danych, determinowana przez ich kompletność (ang. completness), dokładność (ang. accuracy) oraz aktualność (ang. timeliness), wpływa na wytwarzaną na ich podstawie wiedzę (s. 10).

Wrażliwość danych (ang.

sensitivity) (s. 10)

W zależności od tematyki i podmiotów, na temat których gromadzone są dane, mogą one zawierać informacje o zróżnicowanym stopniu poufności.

Stopień poufności danych definiuje ich użyteczność.

Im większa poufność danych, tym większe możliwości ich wykorzystania, np. w formie spersonalizowanych, przeznaczonych do konkretnego użytkownika przekazów.

Interoperacyjność/łączenie danych (ang. interoperability/linkability) (s. 10)

Zestawianie ze sobą danych może zwiększać ich wartość np. dzięki możliwości znalezienia nieznanych dotąd korelacji. Jest to jednak możliwe wówczas, gdy bazy danych oraz pojedyncze dane w ich ramach można ze sobą połączyć.

Możliwości wykluczania danych (ang. excludability) (s. 11)

Choć dane mogą być wykorzystywane wielokrotnie i przez różne podmioty, możliwości ich gromadzenia i dostęp do nich są zróżnicowane. Poniżej zestawiano dwa przeciwstawne przykłady:

● dane związane z czynnościami administracyjnymi instytucji państwa mogą być gromadzone jedynie przez określone jednostki;

● dane o dobrach publicznych (np. środowisku naturalnym) – przy odpowiednim potencjale technologicznym – można gromadzić bez takich ograniczeń.

Dostępność danych (ang.

accessibility) (s. 11)

Zróżnicowanie poziomów dostępności danych można skategoryzować w następujący sposób:

● dane niewspółdzielone, wykorzystywane przez jeden podmiot lub instytucję;

● dane przeznaczone dla wąsko zdefiniowanej grupy;

● dane dostępne publicznie dla wszystkich jednostek i podmiotów, które chcą z nich skorzystać.