Со сленгом и без цензуры: искусственный интеллект впервые научили говорить на украинском языке

Разработчики технологического креативного агентства ISD Group впервые научили искусственный интеллект разговаривать на украинском языке. Теперь он не просто может генерировать связный текст, но и отвечает в наиболее непредсказуемый и неординарный способ. Об этом сообщили в пресс-релизе проекта.

«Представьте себе сознание, которое ничего не знает о современном мире. А тем более, что значит отрываться. Представили? Все, что сейчас знает и умеет наш AI — это опыт людей, собранный в единый user-generated датасет, это воплощение безумного коллективного сознания», — рассказала креативная лидерка и арт-директорка проекта Наталья Тачинская.

Сообщается, что свою версию искусственного интеллекта разработчики ISD Group создали на базе модели GPT-2 от Hugging Face. Эти наработки позволяют нейросети генерировать связный текст, который максимально напоминает речь людей.

На первом этапе разработчики создали речевой корпус нейросети с помощью открытых баз словарей. После этого генератор GPT-2 дополнили инструментами, которые помогают выстраивать контекст и корректные последовательности слов в текстах: Hugging Face Transformers, PyTorch, LanguageTool. В результате искусственный интеллект «разговаривал» старомодно, и к речевому корпусу добавили субтитры современных фильмов, сериалов, блогов, твиттов и другой пользовательский контент из соцсетей. Таким образом, AI начал говорить более современно и сленгово.

«На втором этапе мы решили пойти на эксперимент. Не повторять создание нейтральной системы, искусственного советника, а пойти дальше и предоставить ему характер. Это плохой парень, даже немного сумасшедший, который постоянно подталкивает своих друзей на какие-то безумные поступки», — рассказала CEO и креативный директор ISD Group Виктор Шкурба.

Позже к сбору датасета привлекли молодежь с помощью игровых Telegram-ботов. Пользователи отвечали на вопросы и своими ответами «кормили» нейросеть. Потом разработчики через нейросеть в несколько раундов проганяли придуманные искусственным интеллектом идеи и обозначали наиболее удачные — в результате нейросеть получала «плюсы» и научилась генерировать последовательность ответов в сторону наиболее непредсказуемых и неординарных.

Испытать нейросеть можно по ссылке

Напомним, в сентябре 2020 года в павильоне №23 на столичном ВДНГ откроют первое интерактивное пространство Малой академии наук Украины — «Музей науки» с более 120 экспонатами и инсталляциями. Над экспозицией работали команды из пяти стран.