В России начали разрабатывать систему для поиска противоправного контента, в том числе в соцсетях

В России начали разрабатывать систему для поиска противоправного контента, в том числе в соцсетях
Фото: Новый Калининград

Роскомнадзор нашел разработчика для системы «Окулус», которая на основе нейросетей будет анализировать фото, видео и тексты на сайтах, в соцсетях и мессенджерах на предмет запрещенной информации. Об этом пишет «Коммерсант».

На разработку  системы «Окулус» выделено 57,7 млн руб., по техзаданию она должна появиться уже к декабрю. «Окулус» будет в реальном времени анализировать изображения и видео, переписки в чатах и материалы каналов мессенджеров, URL-адреса и другие данные на предмет запрещенной информации.

Система должна находить запрещенный контент не только в текстовом виде, но и в «сценах, сочетаниях предметов, композициях образов, лицах, статике и динамике движений».

«По условиям тендера подрядчик обязан не только создать систему, но и предоставить ГРЧЦ дата-сеты, которые позволят определять запрещенную информацию. Исполнитель также поставит ГРЧЦ размеченные наборы данных для обучения модели распознавания лиц „в объеме не менее 100“, так как в „Окулус“ должен быть реализован „функционал каталогов определяемой символики, сцен и действий, персоналий“», — отмечает издание.

Мощность системы должна составить 200 тыс. изображений в сутки, это значит, что в секунду «Окулус» будет анализировать два кадра или картинки.

В список запрещенного контента, который призвана анализировать система (содержится в приложении к техдокументации), помимо материалов с признаками экстремизма и терроризма, призывов к массовым незаконным мероприятиям, выражения явного неуважение к обществу, государству и официальным символам РФ, информации о способах совершения суицида и методах изготовления наркотиков, вошли также пропаганда нетрадиционных сексуальных отношений и демонстрация употребления табачной продукции.

Собеседники «Коммерсанта» в IT-отрасли отметили, что современное развитие технологий такую систему создать позволяет, но для этого нужен гораздо более длительный срок. Нынешние модели искусственного интеллекта, говорит эксперт, классифицирующие поведение человека в видеоряде, обычно обучаются на данных объемом около 1 млн роликов.

Нашли ошибку? Cообщить об ошибке можно, выделив ее и нажав Ctrl+Enter



[x]