Статистический анализ — это изучение издания/сайта с помощью инструментов статистики. Объектом для анализа может выступать практически что угодно. Например, при исследовании интернет-СМИ можно изучить такие показатели, как динамика просмотров материалов, частотность использования тех или иных слов, специфичность фраз; можно также проследить, какие люди чаще всего упоминаются в публикациях, на какие источники ссылаются журналисты и т.д.
Статистический анализ неизменно сопровождается красочной визуализацией данных: линейные, столбчатые, круговые, пузырьковые диаграммы, гистограммы, скаттер-плоты и многое другое. При желании, анализ дополняется нейросетью, обученной на данных издания. Она может, например, создавать типичные заголовки или генерировать тексты в стиле какого-либо журналиста.
Анализ осонован на датасете, собранном с сайта газеты «Рязанские Ведомости». Датасет включает в себя 73 000 материалов с 2010 по 2021 год.
Рязань (Рязанская область, Рязанцы) – встречается в 31% заголовков
Россия – 3%
ДТП – 2%
Николай Любимов – 1,5%
Коронавирус – 1%
Рязань (Рязанская область, Рязанцы) – встречается в 60% текстов
Россия – 35%
Регион – 34%
Сообщает – 30%
Район – 16%
Всего в издании 162 уникальные рубрики. Полный список представлен здесь
В Рязани наградили медиков, оказывавших помощь пострадавшим в крупном ДТП в Михайловском районе – 35 113 просмотров
9 Мая в Рязани. Программа праздника – 24 777
«Голубое топливо» идет в регионы – 22 720
1. Николай Любимов
>10 700 упоминаний
2. Олег Ковалёв
>2300
3. Аркадий Фомин
>1250
4. Сергей Филимонов
>940
5. Елена Сорокина
>900
1. УМВД Рязанской области
>9 000 упоминаний
2. МЧС Рязанской области
>5100
3. МВД России
>3300
4. ГИБДД Рязанской области
>2400
5. Рязанская областная Дума
>2200
💎 Для СМИ и других замечательных проектов
⏳ Получение в течение трёх дней
🥰 Поддержка по всем вопросам