Датасет по игровой зависимости собрал один из ютуберов, в прошлом психолог. Датасет крупный, цепляет где-то 1% ГС. Однако проблема в том, что данные грязные, не были формализованы ответы на многие вопросы + одна из самых ценных частей (опросник) была составлена интуитивно, без научной опробации. Был выдвинут ряд исследовательских гипотез:
- У подростков (13-17 лет) и молодых взрослых (18-22) наблюдается повышение баллов по опроснику
- У игроков, играющих больше игр в неделю, наблюдается повышение баллов по опроснику
- У игроков с высоким актуальным рейтингом наблюдается повышение баллов по опроснику
- В возрастных группах 18+ связь между количеством игр в неделю и вовлеченностью усиливается
- На основании ответов на вопросы об отношении к игре можно кластеризовать игроков
- Эти класстеры будут различаться по возрасту, вовлечённости в игру, часам в игре, рейтингу
- Сравнить результаты анализа, полученные в парадигме байесовской и фреквентистской статистики
- Автоматизировать оформление результатов по стандарту APA
- library(tidyverse) --- пайплайны и тиблы
- library(pwr) --- анализ мощности
- library(emmeans) --- попарные сравнения
- library(rempsyc) --- вывод таблиц
- library(broom) --- вывод таблиц
- library(flextable) --- вывод таблиц
- library(apaTables) --- вывод таблиц
- library(rempsyc) --- вывод таблиц
- library(poLCA) --- кластеризация
- library(ez) --- фреквентистская анова
- library(BayesFactor) --- байесовская анова
- Чистка данных, работа с пропусками/выбросами/невозможными значениями, редактирование форматов (Game_addiction_prep)
- Изучения распредления переменных, эксплаторный факторный анализ, визуализация (Game_addiciton_main)
- Проверка допущений, проверка гипотез с помощью линейных моделей и попарных сравнений, визуализация (Game_addiciton_main)
- Подсчёт полученной мощности (Game_addiciton_main)
- Оформление результатов по APA (Game_addiciton_main)
- Перевод itemов в трёхбальные шкалы, LCA для классификации по отношению к игре, визуализации (Game_addiciton_main)
- Проверка дополнительный гипотез с помощью байесовской и фреквентистской статистики, сравнение результатов, визуализации (Game_addiciton_main)
- Из основных гипотез первые две подтвердились, вторые две нет: повышение баллов по опроснику наблюдалось у подростков и молодых людей, а также тех, кто играет больше игр в неделю
- Получить осмысленные класстеры удалось
- Различия по возрасту и другим параметрам значимы - "агро-школьники" это не миф
- На таком крупном датасете использование байесовской и фреквентистской статистики привело к одинаковым выводам, однако интерпретация байесовского варианта более наглядна