• Nenhum resultado encontrado

2. Pojęciowe i teoretyczne ramy analizy

2.1 Dane cyfrowe

2.1.1 Uzasadnienie wyboru pojęcia

Pomimo rosnącego znaczenia danych w literaturze przedmiotu brak jest uniwersalnego sposobu myślenia o nich, do którego badacze mogliby się odnieść (Borgman, 2016; Desouza, Jacob, 2017). Również w świecie biznesu nie wykrystalizowała się jednoznaczna definicja

tego kluczowego dla cyfrowej transformacji zjawiska (Fasel, Meier, 2016). Charakterystyczna jest jednak nie tylko niejednoznaczność definicji, lecz również bogactwo stosowanej terminologii. W konsekwencji do opisu tego samego zjawiska stosuje się wymiennie takie terminy jak big data (np. Maciejewski, 2017), dane cyfrowe (ang. digital data) (np. Marres, 2017) czy dane (ang. data) (np. Flyverbom i in., 2019; Marres, 2017; van Dijck, 2017).

Powyższe pojęcia wykorzystywane są wymiennie, także w tych samych publikacjach, do opisu tych samych zjawisk. Na przykład, Marres (2017) używa wymiennie pojęć danych cyfrowych i danych. Flyverbom i in. (2019) wykorzystują sformułowania big data i dane cyfrowe, van Dijck (2017), Jin i in. (2015) oraz Stephens-Davidowitz (2017) posługują się terminami dane i big data. Reasumując, zanim badacz podejmie decyzję o wyborze definicji, musi również dokonać wyboru konkretnego pojęcia.

W niniejszej pracy za Marres (2017) wybrano pojęcie danych cyfrowych (ang. digital data).

Również za Marres (2017) pojęcie to jest używane wymiennie z określeniem danych (ang.

data). Strategię tę przyjęto również ze względów stylistycznych. Jednocześnie, co kluczowe, zrezygnowano z terminu big data. Punktem wyjścia do tej decyzji było nastawienie badaczy dystansujących się od tego pojęcia (por. boyd6, Crawford, 2012; Greenfield 2017; Kitchin, 2014a; Mayer-Schönberger, Cukier, 2013; Stephens-Davidowitz, 2017), a nawet kategoryzujących go jako slogan (Greenfield, 2017) czy modne, niewystarczające lub mało zrozumiałe sformułowanie (Borck, 2017; Fasel, Meier, 2016; Stephens-Davidowitz, 2017).

Pojęcie to jest bowiem jedynie elementem większego zjawiska, które Kitchin (2014a) określa mianem rewolucji danych (s. xv). Rewolucja danych jest równoznaczna z digitalizacją oraz łączeniem i udostępnianiem zbiorów danych przy jednoczesnym dostosowywaniu do nowych warunków technologicznych kształtu instytucji oraz sposobów ich działania. Kluczowe dla tego procesu są możliwości zrozumienia rzeczywistości przy pomocy analizy danych (Mayer- Schönberger, Cukier, 2013). To właśnie dane stanowią podstawę funkcjonowania gospodarki opartej na informacji (van Dijck, 2017), redefiniują sposoby wytwarzania nauki oraz aktywności rządów czy środowiska biznesowego (Kitchin, 2014a). Podsumowując, stają się źródłem wiedzy, która może znaleźć zastosowanie w praktyce (Kaufmann, 2016).

Zdystansowanie środowiska naukowego wobec pojęcia big data ma jednak zróżnicowane przyczyny. Po pierwsze, wynika z niechęci do akcentowania jedynie objętości danych (angielskie słowo big – duży). Konsekwentnie, analizujący kwestie danych cyfrowych zwracają na inne niż objętość aspekty. Na przykład, boyd i Crawford (2012) opisują big data jako […] kulturowe, techniczne i naukowe zjawisko […] (s. 663). I choć sformułowanie big data jest osadzone w dyskursie (Beer, 2016; Cope, Kalantzis, 2016) oraz nadal używane do opisu technologicznych zmian takich jak wprowadzenie komputerów osobistych (lata 70 XX

6 Pisownia nazwiska małą literą zgodnie z wytycznymi badaczki.

w.), rozwój internetu (lata 90 XX w.) czy mediów społecznościowych (początek XX w.) (Ekbia i in., 2014), może się ono w przyszłości okazać niewystarczające do zdefiniowania skali obserwowanego trendu (Marr, 2016). Zwiększające się możliwości obliczeniowe i zbierania danych zmieniają bowiem definicje wielkości danych uważanych za duże (big) (McKinsey Global Institute, 2011). Na przykład, według przewidywań Komisji Europejskiej, w okresie od 2018 do 2025 roku ilość danych wzrośnie o 530 proc. (Komisja Europejska European data strategy, 2020b). Wobec takiej dynamiki zmian rozróżnienie pomiędzy małymi a dużymi danymi jest pozbawioną naukowej podstawy, arbitralną decyzją (Stephens- Davidowitz, 2017). Zaś, stosowany np. przez Borgman (2016), podział na małe i duże dane (ang. small/big data) powoduje trudności w sposobie ich definiowania (Mohanty, 2015).

Po drugie, dystans do pojęcia big data wynika nie tylko ze stale zwiększającej się i tym samym trudnej do określenia, wielkości danych, lecz również chęci akcentowania ich innych cech charakterystycznych, np. możliwości analizowania nieoczywistych do tej pory relacji. Ten sposób myślenia widoczny jest u boyd i Crawford (2012):

W big data mniej chodzi o wielkość danych niż o możliwości wyszukiwania, łączenia i odnoszenia do siebie dużych zbiorów danych (s. 663).

Podobnie argumentuje Stephens-Davidowitz (2017), dla którego ilość gromadzonych danych jest wtórna wobec możliwości znalezienia odpowiedzi na pytania dotyczące wzorców zachowań społecznych. Również Mayer-Schönberger i Cukier (2013) pod pojęciem big data rozumieją sposób myślenia o danych zakładający wyszukiwanie związków między nimi. Ich przedmiotem zainteresowania są wówczas duże ilości zróżnicowanych danych, w ramach badania których rezygnuje się z poszukiwania przyczyn zjawisk na rzecz wychwytywania korelacji. Jednocześnie można wyróżnić badaczy, którzy w ogóle nie nawiązują do wielkości i skali użycia danych (np. Pandya, Sawant, Mendjoge, D’silva, 2015). Big data są dla nich materiałem służącym do poszukiwania wzorców oraz formułowania nowych pytań. W opozycji do big data stawiane są zaś dane tradycyjne wykorzystywane do formułowania odpowiedzi na pytania zadane przed rozpoczęciem procesu badawczego (Pandya i in., 2015).

Dane tradycyjne przeciwstawia się również big data, ponieważ te ostatnie – dzięki środowisku, w którym są wykorzystywane (np. platformy) – mają więcej możliwości zastosowania (Puschmann, Burgess, 2014). O krok dalej w swojej diagnozie idą Sander i Wielaard (2016). Ich zdaniem podkreślanie wielkości danych przy użyciu angielskiego słowa big może wprowadzać w błąd; istotą potencjału tkwiącego w danych nie zawsze jest bowiem wielkość, lecz właśnie umiejętność ich łączenia w celu wyciągania wniosków (Sander, Wielaard, 2016).

Po trzecie, wykorzystanie pojęcia danych cyfrowych zamiast terminu big data można uzasadnić również etymologią oraz momentem upowszechnienia się obu terminów w języku.

Borck (2017) kategoryzuje big data jako […] zjawisko teraźniejszości […] (s. 399), którego przyczyny należy upatrywać m.in. nowych sposobach wytwarzania i analizowania danych.

Przykładanie wagi do danych nie jest jednak zjawiskiem charakterystycznym dla czasów współczesnych, choć postęp technologiczny przyczynia się do generowania ich coraz większych ilości i wzrostu zainteresowania ich zastosowaniami (Beer, 2016). Jak podsumowuje Beer (2016): Pojęcie big data ma krótką historię, która jest częścią trwającej zdecydowanie dłużej, sięgającej kilkaset lat wstecz serii zmian (s. 3-4). Potwierdzeniem jego założeń jest chronologia pojęcia big data – pojęcia tego użyto po raz pierwszy pod koniec lat 90-tych XX w. (Press, 2013). Jak wskazują Fasel i Meier (2016) zakorzeniło się ono przede wszystkim dzięki aktywności korporacji, których modele biznesowe bazują na gromadzeniu i analizowaniu danych. Samo pojęcie danych (ang. data), w sensie matematycznym lub teologicznym, zostało wykorzystane w języku angielskim już w XVII w. Jednak dopiero w XIX i XX w. stało się elementem języka biznesu, administracji czy świata nauki (Puschmann, Burgess, 2014, s. 1691-1692). Wraz z wykorzystaniem komputerów w XX w. danym zaczęto przypisywać nowe znaczenia, patrząc na nie jak na informacje, które można w cyfrowy sposób przechowywać i poddawać kalkulacjom. Upowszechnione w środowisku biznesowym sformułowanie big data początkowo odnoszono przede wszystkim do wyszukiwania i składowania danych. Dziś, w kontekście biznesowym, kojarzy się ono głównie z analizą i budowaniem predykcji (Puschmann, Burgess, 2014).

Należy jednak podkreślić, że choć powyższe argumenty przemawiają za odejściem od pojęcia big data, to jednak całkowita rezygnacja z tego terminu byłaby niemożliwa. Wynika to chociażby z zakorzenienia pojęcia big data w dyskursie (Cope, Kalantzis, 2016). W praktyce badawczej oznaczałoby to konieczność znacznego ograniczenia dostępnych źródeł. Tym bardziej, że, jak wskazano, terminy takie jak dane, dane cyfrowe czy właśnie big data są wykorzystywane do opisu analogicznych zjawisk w ramach tych samych publikacji (m.in.

Flyverbom i in., 2019; Maciejewski, 2017; Marres, 2017; van Dijck 2017). Odpowiedzią na ten chaos pojęciowy jest konsekwentne wykorzystywanie w pracy pojęcia danych cyfrowych oraz danych.