Techniki informatyczne pozwalają skutecznie odróżniać treści ekstremistyczne od treści neutralnych publikowanych w sieci – udowodnił w swojej pracy doktorskiej Bartłomiej Balcerzak. Opracował on algorytmy, które rozpoznają formy języka typowego dla ruchów ekstremistycznych.
Chodzi o ruchy reprezentujące islamski fundamentalizm oraz skrajne ruchy lewicowe i prawicowe.
„W ostatnich latach ekstremizm, zwłaszcza jego brutalne formy, stał się częstym zjawiskiem w politycznym i społecznym krajobrazie. Niezależnie od tego, czy przyjmuje formę religijnego fanatyzmu, czy radykalnych ruchów ideologicznych, ekstremizm stanowi wyzwanie dla społeczeństwa obywatelskiego” – mówi dr Balcerzak.
Naukowiec z Wydziału Informatyki Polsko-Japońskiej Akademii Technik Komputerowych wykorzystał serię różnych cech językowych do rozpoznawania ekstremizmów. Są to cechy związane z pojawieniem się określonych słów, ale także emocji wyrażanych w tekstach. Dr Balcerzak przeanalizował tematy poruszane przez ekstremistów i sposób, w jaki się oni wypowiadają. Skupił się też na cechach narracyjnych, czyli odwołaniach do walki „my kontra oni„, nawoływania do przemocy. Zaskoczyło go, jak wiele negatywnych emocji, a mało pozytywnych zawierają teksty nacechowane ekstremistycznie. Zjawisko to badacz nazywa „smutnym światem oblężonej fortecy”.
Algorytmy rozpoznają cechy języka ekstremizmu
„Opracowałem metody rozpoznawania argumentów typowych dla języka ekstremizmu. Wśród takich form wyróżniłem odwołanie do własnej grupy, odwołanie do wroga (zarówno zewnętrznego jak i wewnętrznego) oraz manipulacje emocjonalne lub wezwania do działania. Moja proponowana metoda zaoferowała wyniki lepsze, niż dotychczas stosowane metody analizy i automatycznej klasyfikacji tekstu” – ocenia autor pracy doktorskiej.
Analizowane przez niego treści ekstremistyczne nie pochodziły z jednego źródła ideologicznego, ale reprezentowały trzy różne skrajnie ideologie. Badacz chciał w ten sposób uniknąć zarzutów o opowiadanie się po jednej stronie jakiejkolwiek politycznej debaty. Posługiwał się m.in. tekstami publikowanymi w lewicowych sewisach amerykańskich i na profilu ISIS w portalu społecznościowym Twitter.
„Łącząc te wszystkie cechy, które wykrywałem za pomocą algorytmów – które +patrzyły+, czy pewne frazy powtarzają się w struktrze tekstu, byłem w stanie skutecznie odróżniać treści ekstremistyczne od treści neutralnych” – mówi doktor. Jego praca ma charakter informatyczny, ale zawiera także części poświęcone zagadnieniom z psychologii czy lingwistyki. Prezentuje metodę kategoryzacji grup słów przy pomocy reprezentacji wektorowej.
„W swojej rozprawie chciałem odpowiedzieć na pytanie, czy możliwe jest wykorzystanie technik informatycznych do automatycznego rozpoznawania form języka typowego dla ruchów ekstremalnych. Analiza treści reprezentujących islamski fundamentalizm oraz ruchy skrajne z prawej i lewej strony politycznego spektrum pokazała, że takie zadanie jest możliwe – podsumowuje dr Balcerzak.
Wyniki swoich badań informatyk przedstawił 12 kwietnia, podczas obrony pracy doktorskiej „Empirical Analysis and Automatic Recognition of Extremism in Online Texts”. Promotorem rozprawy doktorskiej był dr hab. Adam Wierzbicki z PJATK, promotorem pomocnicznym – dr Radosław Nielek z PJATK, a recenzentami – dr Rafał Rzepka z Uniwersytetu Hokkaido oraz dr Lisa Kaati ze Swedish Defense Research Agency.
Źródło: Serwis Nauka w Polsce – www.naukawpolsce.pap.pl