Doktorant Wojskowej Akademii Technicznej opracował kompleksową analizę technik wykrywania źródeł fake newsów, która pozwoli efektywniej przeciwdziałać dezinformacji. To pierwsze tak wszechstronne podejście do tego tematu, ale nie pierwsze osiągnięcie młodego naukowca. Mjr mgr inż. Damian Frąszczak jest już także autorem nowatorskiego oprogramowania RPaSDT, które umożliwia ustalenie źródła fałszywych informacji i sposób ich rozprzestrzeniania w mediach społecznościowych. 

Social media są powszechnie wykorzystywane przez miliardy ludzi na całym świecie jako miejsce komunikacji, wymiany informacji i opinii. Niestety, wraz z większą popularnością i rosnącą liczbą użytkowników narasta także problem dezinformacji, czyli rozpowszechniania fałszywych lub mylących treści. Portale społecznościowe to miejsca, w których mnóstwo jest fake newsów i materiałów stosujących manipulację – te wiadomości szybko się rozprzestrzeniają, a w konsekwencji wpływają na przekonania i postawy odbiorców. Fake news nie jest niewinnym kłamstwem. Wywołuje konkretne zachowania – od decyzji zakupowych, przez emocje wobec wybranych grup, ludzi czy miejsc, aż po wyniki wyborów.

W sieci komunikacji i… dezinformacji

Media społecznościowe gwarantują szybką i wygodną komunikację z wieloma osobami. To także przestrzeń, w której łatwo możemy uzyskać informację lub podać ją dalej. Na bieżąco dostajemy także powiadomienia o nowych treściach. Wszystko to sprzyja wymianie materiałów w rozbudowanej sieci społeczności, bez względu na miejsce, w którym jesteśmy. To jednak nie tylko szereg korzyści, ale i doskonałe warunki do działań dezinformujących. Użytkownicy bombardowani są wiadomościami, zdjęciami i filmami. Ocena treści i weryfikacja – prawda czy fałsz – jest bardzo trudna. W dużej mierze bazuje też wyłącznie na subiektywnych odczuciach. Co gorsza, fake newsów w sieci przybywa w błyskawicznym tempie. Jak je powstrzymać? Z pewnością niezbędne są skuteczne narzędzia do ich wykrywania i ograniczania wpływu. Kluczowe znaczenie w tej walce ma identyfikacja źródła informacji.

Zacznijmy od źródła – a raczej od źródeł

Wykrywanie ognisk propagacji fałszywych wiadomości w sieciach społecznościowych to dziedzina badań koncentrująca się na opracowywaniu metod, które pomogą w identyfikowaniu i ograniczaniu rozprzestrzeniania się dezinformacji. Celem jest znalezienie grup użytkowników, którzy propagowali wiadomość w swojej lokalnej społeczności, by następnie w ramach każdego z ognisk spróbować zidentyfikować użytkowników źródłowych.

Obecne prace w tej dziedzinie często ograniczają się do pojedynczych źródeł – co w praktyce okazuje się niewystarczające. Mjr mgr inż. Damian Frąszczak w swoich badaniach skupił się na problemie wykrywania wybuchów plotek w sieciach społecznościowych, a w ramach pracy przedstawił pierwszą tak kompleksową analizę technik wykrywania ognisk propagacji bez znajomości dokładnej liczby węzłów źródłowych i ocenę ich skuteczności. „W większości przypadków proces dystrybucji fake newsów rozpoczyna się od wielu użytkowników jednocześnie. Choć istnieje sporo artykułów na temat wykrywania prawdziwego źródła z tylko jednym inicjatorem, wciąż brakuje rozwiązań dedykowanych problemom z wieloma źródłami. Większość rozwiązań spełniających te kryteria wymaga dokładnej liczby źródeł do ich poprawnego wykrycia. To jest niemożliwe do uzyskania w rzeczywistych zastosowaniach. Aby wypełnić tę lukę, przeanalizowałem metody wykrywania wybuchów plotek w internetowych sieciach społecznościowych” – wyjaśnia naukowiec.

Dyskusja z botem

Jak podkreśla mjr Frąszczak, wciąż brakuje metod, dzięki którym można poprawnie oszacować rzeczywistą liczbę źródeł. Wszystkie dostępne techniki zostały zaprojektowane do użycia w innym kontekście niż wykrywanie źródeł plotek. „Większość dostępnych metod przeszacowuje całkowitą liczbę potencjalnych źródeł. Kolejną słabą stroną jest wykrywanie pustych ognisk, czyli np. botów, a nie prawdziwego źródła. Prawidłowe wykrycie ogniska ma kluczowe znaczenie dla znalezienia wielu źródeł” – zaznacza autor analizy.

W większości przypadków fałszywe wiadomości lub plotki na platformach mediów społecznościowych są inicjowane przez grupy użytkowników zlokalizowanych w różnych miejscach. Wielu pozornie realnych użytkowników to fałszywe konta – nie są to istniejące osoby, tylko boty komputerowe propagujące odpowiednie wiadomości. Co istotne, bota można łatwo dołączyć do sieci lub odłączyć od niej. Umieszczane są one w różnych częściach sieci, by jak najszerzej wpłynąć na użytkowników i szybko zapełnić sieć fałszywymi treściami. Jest to działanie tym bardziej niebezpieczne, iż odbiorcy w większym stopniu wierzą w informacje i dzielą się nimi chętniej, gdy można je potwierdzić w kilku różnych źródłach. Zdecydowanie trudniej jest sklasyfikować daną treść jako fałszywą, gdy jest ona rozpowszechniana w wielu grupach jednocześnie.

Badania możliwe dzięki autorskiemu narzędziu

Mjr Frąszczak przeanalizował różne metody podziału sieci i wykrywania społeczności. Zidentyfikował  najlepsze podejścia oraz wskazał słabe strony dostępnych rozwiązań. Dzięki przeprowadzonej analizie i badaniom efektywności wybrał konkretne techniki i kierunek, w którym powinny się one rozwijać, aby można było skutecznie przeciwdziałać rozprzestrzenianiu się dezinformacji w social mediach.

Do przeprowadzenia prac badawczych autor wykorzystał autorskie oprogramowanie RPaSDT, które pozwala na przeprowadzenie zaawansowanych badań dotyczących analizy sieci społecznościowych zarówno na danych symulacyjnych, jak i rzeczywistych. Doktorant WAT przeprowadził szereg testów polegających na zasymulowaniu propagacji plotki w sieciach społecznościowych o zróżnicowanej strukturze. Na podstawie aktywności węzłów w ramach badania symulacyjnego zbudował graf propagacji, czyli wycinek sieci składający się z osób, które aktywnie brały udział w przekazywaniu fałszywej wiadomości. Następnie przeprowadził badania identyfikacji ognisk propagacji, źródeł propagacji w zidentyfikowanych ogniskach oraz analizę skuteczności metod. 

Wyniki, które uzyskał autor, pokazują, że dokładność metod wzrasta, gdy są one stosowane do rzeczywistych wybuchów propagacji. Młody naukowiec podkreśla potrzebę opracowania niezawodnych rozwiązań, które uwzględnią specyficzne właściwości rozprzestrzeniania się plotek w sieciach społecznościowych, a jednocześnie będą wydajne obliczeniowo i sprawdzą się w dużych sieciach społecznościowych.

Nie tak łatwo prześcignąć fake newsa

Choć znalezienie źródła plotki jest kluczowe w kwestii uczenia się o rozprzestrzenianiu się fałszywych informacji w sieciach i zapobiegania im, identyfikacja rzeczywistych źródeł nie jest prostym zadaniem, choćby ze względu na rozmiar i złożoną strukturę sieci czy szybkość rozpowszechniania się informacji w internecie. Często materiały są udostępniane przez anonimowych użytkowników lub przez konta stworzone specjalnie w celu rozprzestrzeniania dezinformacji. To utrudnia śledzenie źródła informacji i zidentyfikowanie osób czy grup odpowiedzialnych za jej tworzenie. Co więcej, niektóre fake newsy mogą pochodzić z zaufanych źródeł, które same zostały wprowadzone w błąd i opublikowały niezweryfikowaną informację lub zostały celowo wykorzystane do manipulacji opinią publiczną. Także pojęcie źródła w kontekście sieci społecznościowych może być niejednoznaczne. Informacje często są rozprzestrzeniane przez użytkowników poprzez udostępnianie, komentowanie i ponowne udostępnianie. W takich przypadkach geneza staje się skomplikowana, ponieważ w procesie rozprzestrzeniania wiadomości informacje mogą być modyfikowane i przetwarzane przez różne osoby. Dzięki pracy naukowca z WAT zidentyfikowanie punktu wyjścia i prześledzenie całego procesu, a w efekcie pokonanie takich wyzwań może okazać się znacznie łatwiejsze.

Drogowskaz dla przyszłych badań

Efekty pracy mjr. Frąszczaka mogą znacząco wpłynąć na przyszłe prace naukowe dotyczące wykrywania ognisk dezinformacji w sieciach społecznościowych. Przygotowana przez doktoranta kompleksowa analiza stosowanych technik dostarcza istotnych wskazówek dla dalszych badań w dziedzinie identyfikacji źródeł propagacji. Wskazuje mocne i słabe strony metod znanych w literaturze, co pozwala skupić się na budowie skuteczniejszych rozwiązań. Dzięki temu dalsze badania będą mogły skoncentrować się wyłącznie na tym, co zostało sprawdzone w działaniu. To znacznie ułatwi i przyspieszy pracę naukowców i poprawi efektywność dostępnych technik.

„Jeżeli jedna z metod w większości badań uzyskiwała lepsze wyniki niż pozostałe, to naturalnym wnioskiem jest, że powinniśmy dokładnie ją przeanalizować i sprawdzić, jak zmodyfikować jej algorytm czy charakterystyki, które wykorzystuje, by uzyskać najlepszy efekt” – zaznacza naukowiec.

Autor podkreśla, że wprowadzenie nowych metod, które uwzględniają specyficzne właściwości rozprzestrzeniania się plotek, może przyczynić się do poprawy dokładności i skuteczności wykrywania źródeł. „Badania w tej dziedzinie powinny skupić się na opracowaniu rozwiązań, które są efektywne obliczeniowo i nadają się do zastosowania w sieciach społecznościowych o dużej skali. Moje wyniki stanowią solidną podstawę dla przyszłych prac naukowych mających na celu rozwinięcie tej problematyki” – podsumowuje mjr mgr inż. Damian Frąszczak.

Jeden pomysł, wiele zastosowań

Praca doktoranta WAT dostarcza cennych wskazówek dla dalszych badań i rozwoju skutecznych narzędzi wykrywania wybuchów plotek.

Opracowany przez mjr. Frąszczaka pomysł wykrywania wybuchów plotek w sieciach społecznościowych może znacznie poprawić bezpieczeństwo w obszarze cyberbezpieczeństwa dzięki ochronie społeczeństwa przed dezinformacją oraz rozpoznaniu i kontrolowaniu rozprzestrzeniania się fałszywych informacji. Choć naukowiec skupił się na problemie identyfikacji fałszywych wiadomości, opublikowane badania mogą zostać wykorzystane również w innych dziedzinach charakteryzujących się podobną dynamiką – przy wykrywaniu źródeł epidemii chorobowych, wirusów komputerowych, w biznesie czy w obszarach związanych z obronnością.

Artykuł „Detecting rumor outbreaks in online social networks” ukazał się w „Social Network Analysis and Mining”. Uzyskał 100 punktów.

DOI: https://link.springer.com/article/10.1007/s13278-023 – 01092‑x

Dominika Naruszko
fot. Katarzyna Puciłowska