«Акулы нейронных сетей» — это коллаборация журналистики и искусственного интеллекта.
Цель проекта — рассказать и показать, как можно использовать ИИ в журналистике.
Искусственный интеллект открывает новые возможности для массмедиа, повышает эффективность рабочих процессов, участвует в создании контента.
Искусственный интеллект в журналистике — это уже не просто модное слово. В эпоху больших данных, в которой мы живём, он может стать реальным рабочим инструментом.
На этом сайте представлены созданные мною программы на основе машинного и глубокого обучения, которые могут быть использованы в различных областях журналистики. Они не являются production-версией и созданы лишь для демонстрации потенциала технологий ИИ.
В настоящее время ИИ применяется, в основном, в трёх областях:
Сбор контента: поиск и извлечение информации, создание сюжетных идей, выявление тенденций, мониторинг событий или проблем. Например, «Одрадек» — мониторинг СМИ и соцсетей
Производство: полное или частичное создание контента. Например: генерация гороскопов, помощь в написании текстов, создание заголовков, написание информационной сводки по COVID-19, рерайтер новостей.
Распространение: персонализация новостной ленты, анализ поведения пользователей. Например, классификация новостных текстов, анализ читательских настроений.
Главные конкретные задачи, которые сейчас решает ИИ:
Автоматическая маркировка / классификация контента
Автоматическая проверка фактов, выявление предубеждений в текстах
Предварительная модерация контента (проверка орфографии, стилистики)
Преобразование речи в текст и наоборот
Персонализация контента
Таргетирование рекламы
Три главные причины, по которым ИИ используется в журналистской организации:
Сделать работу журналистов более эффективной
Предоставлять пользователям более релевантный контент
Повысить прибыльность бизнеса и увеличить конкурентоспособность
Примеры программного обеспечения на базе ИИ, которые сегодня применяются в СМИ:
«Heliograf» (The Washington Post) — инструмент для создания автоматических отчётов. Используется, например, для написания заметок о ходе выборов и результатах спортивных мероприятий.
«JAMES» (The Times) — система для персонализации контента. Анализируя действия и привычки пользователей, «JAMES» предлагает более релевантные материалы.
«Cyborg» (Bloomberg) — система автоматического создания отчётов о доходах компаний. ИИ анализирует массивы данных и извлекает необходимую финансовую информацию.
«Project Feels» (The New York Times) — проект по прогнозированию эмоционального воздействия статей на читателя. Полученные данные используются для показа персонализированной рекламы.
«Voitto» (Yle: финская телерадиокомпания) — система умных рекомендаций новостей, отправка уведомлений с интересными материалами.
«Syllabs» (Le Monde: французская газета) — робот-журналист, создающий отчёты о ходе выборов в более чем 36 000 городах Франции.
«RADAR» (The Press Association: британское национальное агентство новостей) и «ReporterMate» (The Guardian) — системы создания коротких местных новостей: например, о погоде, дорожных происшествиях, работе муниципальных служб. ИИ собирает данные из открытых источников, а затем публикует их в соответствии с подготовленными шаблонами.
СМИ, которые используют в своей деятельности технологии ИИ, выделяют следующие проблемы:
Автоматическое создание контента из некачественных данных ведёт к распространению ложной информации.
«Алгоритмические» предубеждения. Искусственный интеллект обучается на больших наборах данных – но будут ли эти данные содержать объективную информацию? Политическая предвзятость, расовые или гендерные предубеждения могут стать серьёзной проблемой при применении ИИ.
Намеренное распространение фейковых новостей. Технологии ИИ доходят до того уровня, когда становится возможным создавать тысячи поддельных новостей, с виду неотличимых от настоящих. СМИ должны иметь инструменты, которые позволят отличить настоящий материал от сгенерированного нейросетью.
«Пузырь фильтров». Рекомендательные системы, основываясь на действиях и поведении пользователя, показывает ему лишь ту информацию, которую он хотел бы увидеть. Это ведёт к тому, что читатель оказывается в информационном вакууме.
Зависимость от технологических компаний. Огромная доля в разработке технологий ИИ принадлежит таким крупным корпорациям, как Facebook, Google, Microsoft. Именно они, по большей части, определяют, какими инструментами ИИ будут пользоваться СМИ.
Основные проблемы при принятии ИИ «на работу»:
Отсутствие финансовых ресурсов и / или желания инвестировать имеющиеся
Отсутствие навыков для работы с ИИ, трудности с привлечением необходимых кадров
Скептицизм по отношению к новым технологиям в сочетании со страхом потери работы
Недостаток знаний и понимания потенциала ИИ
К техническим проблемам можно отнести: низкое качество существующих технологий, отсутствие наборов обучающих данных, недостаточная техническая оснащённость организации (слабые по мощности компьютеры).
Технологии искусственного интеллекта стремительно развиваются, и трудно сказать, что ждёт нас через несколько лет.
Проведённый среди редакторов новостных агентств опрос выявил несколько ключевых тенденций в развитии искусственного интеллекта. Вот что ждут журналисты от ИИ в будущем:
Более продвинутое производство контента. Например, автоматическое создание сложных аналитических отчётов
Лучшее преобразование речи в текст и текста в речь; высокое качество для большинства языков, а не только для английского
Более точное распознавание фейковых новостей и недостоверных фактов
Новые инструменты для анализа фото- и видеоматериалов
Более глубокий анализ настроений пользователей и улучшение умных рекомендаций
Подготовлено на основе доклада «New powers, new responsibilities. A global survey of journalism and artificial intelligence» («Новые силы, новые обязанности. Глобальный обзор журналистики и искусственного интеллекта») профессора Лондонской школы экономики и политических наук Чарли Беккета (Charlie Beckett).