Coraz częściej pojawiają się raporty, doniesienia medialne i komentarze liderów branży technologicznej, z których wynika, że wyczerpują się zasoby wysokiej jakości danych niezbędnych do trenowania, testowania i rozwijania modeli AI. W związku z tym apel Stuarta Hubbarda, dyrektora ds. AI i rozwoju zaawansowanych technologii w Zebra Technologies jest ważnym głosem w tej debacie i daje nadzieję na rozwiązanie problemu ograniczonego dostępu do danych treningowych.
Wnioski z jednego z raportów wskazują, że badacze zaobserwowali rosnące ograniczenia w wykorzystywaniu danych w domenach internetowych, używanych do generowania zbiorów treningowych do szkolenia sztucznej inteligencji. W okresie od kwietnia 2023 r. do kwietnia 2024 r. dostęp do 25% materiałów pochodzących z najbardziej wartościowych domen został ograniczony, ponieważ coraz więcej witryn blokuje możliwość ich pobierania na potrzeby rozwoju modeli AI. Niektórzy eksperci przewidują, że zasób publicznie dostępnych treści tworzonych przez ludzi może wyczerpać się już między 2026 a 2032 rokiem, a nawet wcześniej.
– Jakość danych stanowi kolejne wyzwanie dla generatywnej sztucznej inteligencji i rozwiązań wykorzystujących głębokie uczenie – powiedział Hubbard. – Niedokładności, błędy systematyczne (ang. biases) czy niewystarczająca różnorodność danych, w związku z czym nie można odzwierciedlić rzeczywistych scenariuszy zastosowań, doprowadzą do powstania nieskutecznych modeli AI. W efekcie nie będą one wspierać rozwoju biznesowego, inteligentnej automatyzacji ani lepszej łączności pracowników pierwszej linii.
Aby rozwiązać te problemy, opracowywane są nowe modele sztucznej inteligencji, rozwiązania do gromadzenia i analizy danych, które otwierają nowe możliwości wykorzystania obecnie niedostatecznie wykorzystywanych źródeł danych. Jednym z takich niewykorzystanych zasobów są dane biznesowe generowane na pierwszej linii — dane wytwarzane w czasie rzeczywistym w ramach przepływów pracy, na urządzeniach i za pośrednictwem przemysłowych systemów technologicznych.
Ogromne ilości danych generowanych tam, gdzie ludzie na co dzień współpracują z maszynami stanowią bogate, ale wciąż w dużej mierze niewykorzystane źródło informacji dla branż takich jak handel detaliczny, produkcja czy logistyka. Przykładowe informacje zbierane przez pracowników pierwszej linii obejmują:
- W handlu detalicznym: poziom zapełnienia półek, grafik pracy, programy lojalnościowe, sposób korzystania ze skanerów przez klientów, zmiany cen w czasie oraz zapytania od klientów;
 - W logistyce: wielkość i kształt paczek, dostępność pojazdów, trasy dostaw, najczęściej wybierane opcje dostawy w zależności od preferencji klienta i miejsca zamieszkania, zdjęcia potwierdzające doręczenie, temperatura i wilgotność;
 - W produkcji: wady i nietypowe cechy materiałów, komponentów oraz gotowych produktów, jakość opakowań, etykietowanie, kody kreskowe i oznaczenia, jakość zwracanych produktów.
 
– Liderzy branży IT, technologii operacyjnych oraz rozwoju AI powinni skoncentrować się na gromadzeniu i wykorzystywaniu danych generowanych w wyniku pracy pracowników pierwszej linii. W realizacji tego procesu pomogą takie technologie jak komputery mobilne z systemami wizyjnymi, agentowa sztuczna inteligencja, rozpoznawanie głosu oraz inteligentne kamery, czujniki i oprogramowanie z algorytmami deep learning i 3D. Dzięki temu będą mogli wyciągnąć z surowych danych praktyczne wnioski i przekształcić je w realną wartość – powiedział Hubbard.
Wraz z postępującą cyfryzacją przepływów pracy, urządzenia mobilne i brzegowe (typu edge) zaczynają samodzielnie gromadzić dane, dostarczając cennych informacji na temat wydajności procesów, wzrostu produktywności oraz wykorzystania zasobów.
Zarówno dane operacyjne, jak i kontekstowe, w tym wzorce interakcji użytkownika oraz kontekst środowiskowy, pozwalają lepiej zrozumieć otoczenie i zachowania pracowników pierwszej linii. Ponadto mogą one również umożliwić konserwację predykcyjną z wykorzystaniem uczenia maszynowego poprzez identyfikację nieprawidłowości w działaniu sprzętu, zanim spowodują one zakłócenia.
Autor/Redaktor publikacji






