Учительницу-нейросеть «Ольгу Станиславовну» научили русскому сленгу и сарказму

Публикация: 04.08.2022
Источник Комментарии

Artificial intelligence systems and education in the future. Artificial intelligence systems and education in the future. Robot is writing mathematic formulas on whiteboard. 3d illustration


Учительницу-нейросеть «Ольгу Станиславовну» научили русскому сленгу и сарказму

Разработчики из компании LiveDune, занимающейся аналитикой социальных сетей, создали нейросеть, способную оценивать тональность комментариев в социальных сетях. Программа, которую в честь учительницы директора компании назвали «Ольга Станиславовна», будет работать вместе с филологами.

Искусственный интеллект владеет сразу двумя языками: в меньшей степени русским литературным и в совершенстве сленгом русского языка, сформировавшимся в 2020–2022 годах. Для обучения нейронной сети разработчики использовали словари оценочных слов и матерных выражений. Но основной акцент они сделали не на литературные сборники, а на язык, на котором говорят в социальных сетях.

Для первичного обучения разработчики вручную разметили 10 тыс. русскоязычных комментариев из социальных сетей клиентов компании. После этого сервис запустили в работу, но, как говорят создатели, практически сразу появились жалобы на некорректную работу ИИ. Программа плохо распознавала сарказм, а, например, комментарий: «это чертовски беспонтовый пост» — считала позитивным.

Пример работы сервиса. Изображение: LiveDune

Чтобы дообучить систему, создатели предоставили клиентам возможность корректировать оценку «Ольги Станиславовны». Исправленные данные направляются в систему и применяются для доработки алгоритмов. Фактически нейросеть использовала для обучения более 500 тыс. записей.

Программисты говорят, что сложнее всего было научить «Ольгу Станиславовну» определять иронию и сарказм. Для этого в нейросеть дополнительно загрузили обучающие материалы — словари жаргонизмов и мата. Ну и, конечно, практика на реальных отзывах с обратной связью от пользователей ИИ.

«Ольга Станиславовна» обладает самым актуальным словарным запасом современного русского сленга — языка, на котором общаются в социальных сетях. Только во «ВКонтакте» через нейросеть «прошло» около 20 млн комментариев. Разработчики планируют использовать данные, накопленные системой, для проведения вместе с филологами исследования русского языка.

Заимствования, сокращения и разговорно-просторечные элементы массово используются нами при общении в сети. Словари, фиксирующие языковую норму, всегда отставали от живой речи, но появление такой нейросети может помочь филологам точнее отслеживать развитие языка.

Мария Рогожина, филолог

Читать далее:

Скоро на Землю обрушится солнечная буря: материал летит со скоростью 800 км/с

Ученые сняли на видео странное существо с щупальцами, которое приняли за цветок

Россия покидает МКС: что теперь будет и почему обслуживание станции под угрозой


Понравилась статья? Поделись с друзьями!

LongReef Team Автор статьи: LongReef Team
22
Нет Комментариев.
Но, вы можете быть первыми кто его оставит

Авторизуйся что бы оставить свой коммент...

Популярные Статьи

Исследователи из Университета Джорджии выяснили, что гориллы в зоопарке Атланты создали новый...
11.08.2022
Исчезнувший родственник кузнечика Prophalangopsis obscura может проживать в Северной Индии и...
11.08.2022
Программисты разработали универсальный алгоритм, который можно установить в любого голосового...
11.08.2022
Инженеры печатают на 3D-принтере материалы со встроенными «жидкостными датчиками». Они могут...
11.08.2022
Самки белолицых обезьян-капуцинов, обитающие в сухих тропических лесах на северо-западе Коста-Рики,...
10.08.2022
Группа исследователей из Калифорнийского университета в Лос-Анджелесе, Калифорнийского университета...
10.08.2022
Палеонтологи повторно оценили ископаемые остатки челюстей, найденных почти 40 лет назад. Результаты...
10.08.2022
По данным НАСА, «потенциально опасный» астероид размером с синего кита пролетит мимо Земли в...
10.08.2022
Оказалось, что CRISPR/Cas9 может привести к геномной нестабильности. Результаты исследования...
10.08.2022
Инженеры создали гибкие и тонкие транзисторы для нейрокомпьютера. Графеновые устройства работают...
10.08.2022
Исследователи Седарс-Синайского медицинского центра создали самые биореалистичные и сложные...
09.08.2022
Исследователи из Венгрии, Иордании, Саудовской Аравии, Великобритании и США разработали систему...
09.08.2022
У чат-бота BlenderBot 3 с искусственным интеллектом оказались смешанные чувства к генеральному...
09.08.2022
Команда исследователей Университета Карнеги-Меллона заявила о разработке первого искусственного...
08.08.2022
Искусственные мускулы можно использовать для простого и доступного производства скрученных...
08.08.2022
Ученые из США представили метод печати материалов, которые одновременно являются прочными, но...
07.08.2022
Ровер НАСА Perseverance сфотографировал свои же обломки аппаратуры для спуска и посадки на планету....
07.08.2022
Искусственный палец может определять различные материалы с точностью больше, чем 90% только по...
07.08.2022
6 августа исполнилось 77 лет с момента первого сброса ядерной бомбы на Хиросиму. Живых свидетелей...
06.08.2022
Ученые из лаборатории Influit Energy при Иллинойском технологическом институте разработали первое в...
06.08.2022
Новая система на основе наушников показывает внутреннюю структуру уха и мониторит состояние...
05.08.2022
Национальная служба геологии и горного дела показала, как выглядит воронка с высоты птичьего...
05.08.2022
Голограммы студентов из США побывали в Великобритании и Канаде «без оплаты авиабилетов», а их...
05.08.2022
С помощью нового метода оценки радиационного ущерба материалам можно в пять раз точнее определять...
04.08.2022
Физики использовали квантовое машинное обучение для идентификации заряда струй, инициированных...
04.08.2022
Pneumo Vest использует несколько акустических датчиков, расположенных с обеих сторон одежды.
04.08.2022
Подобные скопления появлялись в водах возле Хайфы и раньше, в 2015 и 2017 годах. Теперь в Израиле...
04.08.2022
Полминуты на солнечном свете увеличат время автономной работы умных устройства на десятки минут при...
03.08.2022
Редкий белый слон, родившийся в штате Ракхайн на западе Мьянмы, уже передвигается самостоятельно.
03.08.2022
Интеллектуальная система освещения гораздо полезнее для человека, чем обычные лампы дневного света....
03.08.2022
Международный астрономический союз поддержал обновления, для спутников Starlink. Их назвали...
03.08.2022
Исследователи из Оксфордского университета разработали революционный протез руки, который...
02.08.2022
Исследователи разработали легкий и мощный искусственный мышечный привод для носимых устройств,...
02.08.2022
Международная группа исследователей наблюдала за частью формирования карликовой галактики. Это...
01.08.2022
Новое исследование показало, что распад радиоактивных элементов внутри карликовой планеты может...
01.08.2022
Ученые впервые показали, что электромагнитное излучение может создавать силу между атомами. Это...
01.08.2022
Исследователи создали первую полноценную установку на открытом воздухе, на которой используются...
31.07.2022
Ученые разработали технологию для быстрого производство миниатюрных волноводов с низкими потерями....
30.07.2022
Исследователи нашли способ перемещать протоны через твердые тела с беспрецедентной скоростью....
29.07.2022
Проникая сквозь межзвездный газ, звезда создала нагретые ударные волны, которые светятся на всех...
29.07.2022
Обнаруженные окаменелости относятся к ранней юре, а именно к тоаркскому периоду.
29.07.2022
Когда происходит землетрясение, вибрирующая земля посылает инфразвук высоко в атмосферу. Там их...
29.07.2022
Появилась батарейка из бумаги, которая активируется водой и разлагается после утилизации. Она...
29.07.2022
Опубликована база данных AlphaFold Protein Structure от DeepMind. В нее входит более 200 млн белков.
29.07.2022
Инженеры Массачусетского технологического института разработали крошечную наклейку, которая может...
29.07.2022
Для автомобиля инженер использовал монокристаллические солнечные панели. Они вырабатывают...
28.07.2022
Исследователи из IIT-Istituto Italiano di Tecnologia нашли специфические особенности человеческого...
28.07.2022
Новое исследование поможет исследователям создавать более точные модели эволюции Вселенной...
27.07.2022
На изготовление одного датчика уходит 20-30 минут и стоимость готового устройства составляет около...
27.07.2022
Исследователи из Columbia Engineering создали ИИ, который наблюдает за физическими явлениями с...
27.07.2022
Передача данных с глубины 4 км через соленую воду без каких-либо потерь чрезвычайно сложна. Ученые...
26.07.2022
Россия покинет проект Международной космической станции (МКС) после 2024 года. Сегодня, 26 июля, об...
26.07.2022
Новый инструмент состоит из двух черных рядов из восьми цилиндрических телескопов, соединенных...
25.07.2022
Инженеры придумали дороги, которые заряжают электромобили. Они облегчат переход пользователей на...
25.07.2022
Компания Drift Energy произвела первый экологически чистый водород на борту своего прототипа...
25.07.2022
Компания EPRO Advance Technology объявила о создании способа безопасного хранения и транспортировки...
24.07.2022
Австрийские физики разработали квантовый компьютер на кудитах. Устройство использует для расчетов...
24.07.2022
Всемирная организация здравоохранения назвала стремительно распространяющуюся вспышку оспы обезьян...
23.07.2022
Ученые разработали беспроводной биохимический датчик, который анализирует показатели здоровья на...
23.07.2022
В интернете появилось объявление о продаже персональных данных 5,4 млн пользователей социальной...
23.07.2022