Группа исследователей из Университета Южной Калифорнии помогает искусственному интеллекту представить себе невидимое - метод, который также может привести к созданию более справедливого искусственного интеллекта, новых лекарств и повышению безопасности автономных транспортных средств.
Представьте себе оранжевую кошку. А теперь представьте ту же кошку, но с угольно-черной шерстью. А теперь представьте, что кошка идет вдоль Великой Китайской стены. В результате быстрой серии активаций нейронов в вашем мозгу возникнут варианты представленной картины, основанные на ваших предыдущих знаниях о мире.
Другими словами, нам, как людям, легко представить себе объект с различными атрибутами. Но, несмотря на достижения в области глубоких нейронных сетей, которые соответствуют или превосходят человеческую производительность в определенных задачах, компьютеры все еще испытывают трудности с таким человеческим навыком, как "воображение".
Подписывайтесь на наш youtube канал!
Теперь исследовательская группа Калифорнийского университета в составе профессора информатики Лорана Итти и аспирантов Юнхао Ге, Сами Абу-Эль-Хайджа и Гань Синь разработала ИИ, который использует человекоподобные возможности, чтобы представить себе никогда ранее не виденный объект с различными атрибутами. Работа под названием "Zero-Shot Synthesis with Group-Supervised Learning" была опубликована 7 мая в 2021 году на Международной конференции по изучению представлений.
"Нас вдохновили человеческие способности к визуальному обобщению, чтобы попытаться смоделировать человеческое воображение в машинах", - сказал Ге, ведущий автор исследования.
"Люди могут разделять полученные знания по атрибутам - например, по форме, позе, положению, цвету - и затем объединять их, чтобы представить новый объект. В нашей работе мы попытались смоделировать этот процесс с помощью нейронных сетей".
Допустим, вы хотите создать систему ИИ, которая генерирует изображения автомобилей. В идеале, вы предоставите алгоритму несколько изображений автомобиля, и он сможет генерировать множество типов автомобилей - от Porsche до Pontiac и пикапов - любого цвета и с разных ракурсов.
Это одна из долгожданных целей ИИ: создание моделей, способных к экстраполяции. Это означает, что, получив несколько примеров, модель должна быть способна извлечь из них основные правила и применить их к огромному числу новых примеров, которые она еще не видела. Но чаще всего машины обучаются на образцах, например, пикселях, без учета атрибутов объекта.
В новом исследовании ученые пытаются преодолеть это ограничение с помощью концепции, называемой распутыванием. Дисентеграция может быть использована для создания глубоких подделок, например, путем рассогласования движений человеческого лица и его идентичности. Делая это, говорит Ге, "люди могут синтезировать новые изображения и видео, которые заменяют личность оригинального человека другим человеком, но сохраняют оригинальные движения".
Аналогичным образом, новый подход берет группу образцов изображений, а не по одному образцу за раз, как это делали традиционные алгоритмы, и изучает сходство между ними, чтобы достичь того, что называется "управляемым обучением расчлененного представления".
Затем эти знания комбинируются для достижения "управляемого синтеза новых образов", или того, что можно назвать воображением. "Например, возьмем фильм "Трансформер", - говорит Ге, - он может взять форму машины Мегатрона, цвет и позу желтой машины Бамблби, а также фон нью-йоркской Таймс-сквер. Результатом будет автомобиль Мегатрон цвета Бамблби, едущий по Таймс-сквер, даже если этот образец не был замечен во время тренировки".
Это похоже на то, как мы, люди, экстраполируем: когда человек видит цвет одного объекта, мы можем легко применить его к любому другому объекту, заменив оригинальный цвет на новый. Используя свою методику, группа создала новый набор данных, содержащий 1,56 миллиона изображений, который может помочь будущим исследованиям в этой области.Хотя идея распутывания не нова, исследователи утверждают, что их система может быть совместима практически с любым типом данных или знаний. Это расширяет возможности применения. Например, распутывание знаний, связанных с расой и полом, позволяет создать более справедливый ИИ, полностью исключив из уравнения чувствительные атрибуты.
В области медицины это может помочь врачам и биологам открывать более полезные лекарства, отделяя функцию лекарства от других свойств, а затем комбинируя их для синтеза нового лекарства. Наделение машин воображением также может помочь создать более безопасный ИИ, например, позволяя автономным автомобилям воображать и избегать опасных сценариев, ранее невидимых во время обучения.
"Глубокое обучение уже продемонстрировало непревзойденную производительность и перспективы во многих областях, но слишком часто это происходило путем поверхностной мимикрии и без более глубокого понимания отдельных атрибутов, которые делают каждый объект уникальным", - сказал Итти. "Этот новый подход к распутыванию впервые действительно открывает новые возможности для воображения в системах ИИ, приближая их к человеческому пониманию мира". опубликовано econet.ru по материалам techxplore.com
Лучшие публикации в Telegram-канале Econet.ru. Подписывайтесь!
P.S. И помните, всего лишь изменяя свое потребление - мы вместе изменяем мир! © econet
Источник: https://econet.ru/
Понравилась статья? Напишите свое мнение в комментариях.
Добавить комментарий