Analityka Big Data

Źródło: Pixabay

Potrzeba wdrażania analityki Big Data oraz najbardziej istotne problemy i wyzwania związane z akwizycją danych w przemyśle.

Termin Big Data jest od jakiegoś czasu powszechnie używany i wydaje się, że wszyscy uparcie chcą wykorzystywać narzędzia oraz techniki Big Data, obejmujące również aplikacje przemysłowe. W artykule wyjaśniono, co dokładnie oznacza Big Data, oraz opisano pięć wyzwań związanych z jej wdrażaniem, co powinno pomóc organizacjom przemysłowym w osiągnięciu większych sukcesów w wyniku implementacji rozwiązań akwizycji i analityki Big Data.

1️⃣ Typy i struktura danych

Większość osób pracujących w przemyśle produkcyjnym słyszała już o „Big Data”. Jednak co dokładnie oznacza ten termin, jest już mniej jasne. W skrócie Big Data (czyli duże, zmienne w czasie i różnorodne zbiory danych) jest całościowym terminem odnoszącym się do danych tzw. tradycyjnych oraz danych generowanych poza tradycyjnymi źródłami danych. W kontekście fabryki te tradycyjne dane można podzielić na dwa strumienie: dane technologii operacyjnej (operational technology – OT) i dane technologii informatycznej (information technology – IT). Dane OT w fabryce obejmują dane dotyczące alarmów i zdarzeń, dane zapisywane przez programy do archiwizacji itp. Natomiast dane IT w fabryce to dane dotyczące planowania zasobów przedsiębiorstwa (enterprise resource planning – ERP), które zasadniczo obejmują produkcję, zaopatrzenie i logi dostępu. Tradycyjne dane IT oraz OT są przechowywane w unikalnych systemach i strukturach. Systemy Big Data są „wielostrukturowe” („multistructured”), co oznacza, że mają niezbędne narzędzia do zarządzania wiedzą, które umożliwiają uzyskanie dostępu do różnych danych pochodzących z różnych źródeł, a następnie ich kontekstualizację w celu ich analizowania i sporządzania raportów.

2️⃣ Skalowalność i kontekstualizacja danych

Poza przechowywaniem i akwizycją danych, systemy Big Data muszą być w stanie szybko docierać do odpowiednich danych i analizować je na żądanie, bez podlegania wpływowi tempa i skali akwizycji oraz kwerendowania danych. Nazywamy to skalowalnością Big Data. Jest ona jedną z pierwszych obaw związanych z systemami Big Data. Inne obawy dotyczą niezawodności (funkcjonowania) systemu oraz wspierania procesów podejmowania decyzji w celu analizy danych w czasie rzeczywistym. Analizy obejmują technologie uczenia maszynowego (machine learning – ML) oraz sztucznej inteligencji (artificial intelligence – AI), które mogą pomóc w odnajdowaniu anomalii danych, przewidywaniu zachowań związanych z produkcją i sprzętem, a także dostarczaniu szczegółowych scenariuszy w celu wspierania procesów podejmowania decyzji.

3️⃣ Integracja i wydajność danych

Po ustanowieniu kontekstu Big Data określenie potrzeb staje się prostsze. Natomiast określenie terminu i sposobu wykorzystania analityki Big Data jest sprawą bardziej subtelną. Integracja systemu Big Data w zakładzie wymaga zwiększonego nakładu pracy ze strony całej organizacji, nie tylko ze strony działu IT. Na poziomie szczegółowym pakiety informacji mogą być niewidoczne w organizacji lub czasami celowo utajnione, aby uniknąć tzw. efektu Hawthorne’a (zjawisko będące źródłem błędów podczas prowadzenia badań na grupie ludzi, wynikające z tego, że wiedzą oni o tym, iż uczestniczą w eksperymencie; w naszym przypadku obserwacje mogą zmienić zachowanie). Ignorowanie tych czynników może czasami oznaczać różnicę pomiędzy zainwestowaniem miliona dolarów a zaoszczędzeniem milionów dolarów. Podczas modernizowania rozproszonego systemu sterowania (DCS) w zakładzie przemysłowym, zintegrowanie z nim systemu Big Data w celu uzyskania większej widoczności zakładu wykracza zwykle poza budżet tego zakładu i zakres umiejętności jego pracowników.

4️⃣ Przechowywanie danych

Jeśli pożądane dane muszą być przechowywane lokalnie (ze względu na bezpieczeństwo czy prywatność), to istniejące dane są już zapisane strukturalnie i wymagają tylko analizy i kontekstualizacji z innymi danymi, na przykład przez serwer OPC. Stosowanie zdalnej analizy i wizualizacji za pomocą raportów typu dashboard i złączy danych (data connectors) jest bardziej efektywne finansowo, szczególnie podczas realizowania podobnego wsparcia dla procesów podejmowania decyzji, jak przy wdrażaniu analityki Big Data. Wiele gałęzi przemysłu połączyło już źródła rozbieżnych danych, zaś wykonywane analizy danych oraz uzyskiwane na ich podstawie praktyczne informacje przynoszą różne korzyści dla wydajności produkcji oraz efektywności działania zakładów. Firmy, które zaadaptowały analitykę Big Data jako pierwsze, uzyskają zwykle przewagę nad konkurencją, która nadal wykonuje tradycyjną zintegrowaną analizę danych. Jednak większość gałęzi przemysłu wymaga stosowania obu podejść, zarówno tradycyjnych metod analizy danych, jak i Big Data.

5️⃣ Modernizacje systemów Big Data

Niektóre z największych wyzwań dotyczących analityki Big Data są związane z planowaniem modernizacji systemów analizy danych. Kompleksowe rozwiązanie systemu Big Data może być w sposób ciągły skalowane, tak aby integrowało nowsze źródła danych oraz zaprojektowane pod kątem modernizacji, które nie będą miały wpływu na funkcjonalność i działanie systemu. Dla większości organizacji oznacza to przeniesienie usług do chmury obliczeniowej, modernizacje systemów w celu lepszego monitorowania i rejestrowania danych oraz, niemal zawsze, zwiększania kapitału ludzkiego posiadającego odpowiednie umiejętności w celu wdrażania rozwiązań Big Data w różnych działach organizacji i realizacji różnych funkcji organizacji. Firmy, które posiadają tylko własne zabezpieczenia danych, muszą rozważyć wyższe koszty utrzymywania zakładowych serwerów danych oraz odpowiedniego zespołu do obsługi systemu. Skalowalność systemu może nie być tak efektywna, jak wdrożenia oparte na chmurze. Firmy wykorzystujące technologie Przemysłowego Internetu Rzeczy (IIoT) oraz Big Data mają żywotny interes w wykorzystywaniu rozwiązań Big Data. Co prawda bardziej korzystne jest posiadanie systemu Big Data długoterminowo, jednak luki w istniejących systemach mogą być wypełnione lepiej zorganizowanym podejściem do tradycyjnego zarządzania danymi oraz ich analizowania. Tradycyjna akwizycja danych, ich monitoring oraz uzyskiwanie trendów mogą przynieść znacznie większe korzyści pod względem finansowym. Wdrażanie analityki Big Data musi być poprzedzone wykorzystywaniem starannie zaplanowanych tradycyjnych technologii analizy danych. Tylko wtedy organizacja może zobaczyć korzyści, które mogą przynieść jej systemy Big Data.


Qasim Maqbool jest głównym inżynierem ds. rozwiązań sztucznej inteligencji przemysłowej, a Ahmed Habib – menedżerem marketingu w firmie Intech Process Automation.