Analiza publicznie dostępnych w sieci danych - blogów, forów internetowych, artykułów - pozwala dokładniej niż badania sondażowe przewidzieć wyniki demokratycznych wyborów. Pokazują to w swoich badaniach naukowcy z Uniwersytetu Warszawskiego.
W samej Polsce jest teraz ponad 27 mln internautów. Analizując internetowe treści, można z kilkudniowym wyprzedzeniem przewidzieć wyniki wyborów parlamentarnych czy prezydenckich. I to z dokładnością większą niż sondażownie. Pokazali to naukowcy z Wydziału Dziennikarstwa Informacji i Bibliologii Uniwersytetu Warszawskiego. Badacze próbują też - analizując Big Data, czyli duże, zmienne i różnorodne zbiory danych - przewidzieć trendy gospodarcze i kierunki rozwoju technologii.
Jakie sentymenty budzą słowa „Duda” i „Komorowski”?
Zespół naukowcóow wykorzystuje własne roboty - programy, które przeczesują zadane im źródła informacji w poszukiwaniu konkretnych słów. – Przed wyborami prezydenckimi w 2015 r. skierowaliśmy roboty do wszystkich źródeł polskich informacji, które pisały na temat wyborów. To były gazety, fora, blogi, publiczne posty na Facebooku - wyjaśnia kierownik badań, prof. Włodzimierz Gogołek. Roboty poszukiwały strony, na których padały słowa związane z wyborami: „Duda”, „Komorowski”, „wybory”.
Fot. Pixabay
W zebranych tekstach - po odpowiedniej obróbce - wyszukiwano tzw. sentymenty. Chodzi o emocje, jakie łączone były z poszukiwanymi słowami. Pozytywnymi sentymentami były, np. słowa „zadziwiać”, „lubić”, „pewny”, „wygrana”. A negatywnymi sentymentami, np. „winien”, „zniszczenie”, „upadek”. Sprawdzano, jakie sentymenty pojawiały się w otoczeniu słów „Duda” oraz „Komorowski”. I na tej podstawie wyliczano poparcie dla każdego z kandydatów. – Tydzień przed wyborami wiedzieliśmy, kto wygra. Nasze wyniki były dokładniejsze niż udostępnione przez CBOS – przekonuje prof. Gogołek. System przetestowano już podczas wyborów parlamentarnych w 2011 r. i w 2015 r., a także podczas wyborów prezydenckich w 2015 r.
Na tropie terroryzmu
Sondażownie wykonują badania na próbach tysiąc, dwa tysiące osób. W analizie Big Data zbiory są znacznie, znacznie większe. – To próba badawcza tak duża, że nie można jej osiągnąć w tradycyjnych badaniach. A wiadomo, że im większa próba badawcza, tym dokładniejsze wyniki badań. I to nawet jeśli w tej próbie znalazły się opinie małowartościowe – opowiada dr hab. Wiesław Cetera.
Prognozowanie wyników wyborów to tylko jeden z przykładów tego, jak można wykorzystać Big Data. Naukowcy z UW pomagają ekspertom z Narodowego Centrum Badań i Rozwoju wskazywać kierunki innowacyjnych działań, w które warto inwestować.
Analizowali również występowanie słów związanych z terroryzmem w portalu arabskiej stacji telewizyjnej Al-Dżazira. Z kolei studenci prof. Gogołka wykorzystywali analizę Big Data do próby przewidzenia notowań polskich spółek giełdowych.
– Ameryki nie odkrywamy. Takie systemy analizy dużych zasobów informacyjnych istnieją od wielu lat i są wykorzystywane głównie przez ekonomistów, a szczególnie bankowców. My pokazujemy kolejne przykłady zastosowania takich rozwiązań, m.in. w badaniach nauk humanistycznych, wcześniej zdominowanych badaniami jakościowymi – wyjaśnia prof. Gogołek.
Źródło: PAP
KW
© Artykuł jest chroniony prawem autorskim. Wykorzystanie tylko pod warunkiem podania linkującego źródła.
Inne tematy w dziale Technologie