Топ 14 революционных ИИ изобретений 2023 года от журнала Time
Топ 14 революционных ИИ изобретений 2023 года от журнала Time

Топ 14 революционных ИИ изобретений 2023 года от журнала Time

От «ИИ-булавки», которая потенциально может заменить смартфоны, до инструментов искусственного интеллекта, способных обнаруживать лесные пожары, журнал Time признал несколько наиболее перспективных инноваций в области искусственного интеллекта.

Снова наступило это время года. Журнал Time собрал лучшие 200 изобретений в 2023 году. Были представлены гениальные изобретения из различных областей, таких как доступность, искусственный интеллект, приложения и программное обеспечение, дополненная и виртуальная реальность, красота, потребительская электроника и т. д. В списке представлен ассортимент гаджетов и программного обеспечения от известных технологических брендов, а также малоизвестных стартапов.

Инструменты искусственного интеллекта вызывают волнение по всему миру с момента запуска ChatGPT от OpenAI. С тех пор появилось множество инструментов и приложений искусственного интеллекта. В списке журнала Time представлены некоторые из лучших приложений и инструментов искусственного интеллекта, которые привлекли наше внимание. Итак, перейдём к самому Топу.

FireFly: Photo Editing Outside the Box от Adobe

FireFly: Photo Editing Outside the Box от Adobe

Adobe вооружил миллионы людей мощными возможностями искусственного интеллекта, встроив его прямо в самый популярный редактор изображений в мире — Photoshop. Под управлением FireFly, генератора изображений Adobe, Photoshop теперь включает в себя Generative Expand и Generative Fill. Первый позволяет бесшовно заполнять воображаемое содержимое за границами фотографии. Второй позволяет добавлять или удалять что-то на существующем изображении, просто вводя несколько простых слов. Ни одно из них не требует технической компетенции. Эти опции дарят «клиентам возможность воплотить свои видения в жизнь со скоростью их воображения», говорит Эшли Стилл, старший вице-президент по цифровым медиа в Adobe.

GPT-4 от OpenAI

GPT-4 от OpenAI

Журнал Time описал GPT-4 как самую мощную модель искусственного интеллекта, доступную общественности. GPT-4 отличается вербальным мышлением и способен объяснять сложные концепции простым языком. В сентябре создатели представили возможность взаимодействия пользователей с моделью с использованием голоса и изображений в качестве входных данных. Позднее, в последующем обновлении, GPT-4V вербально описывает содержимое изображения естественным языком. GPT-4 в настоящее время доступен только пользователям ChatGPT Plus, однако существует множество способов использовать GPT-4 бесплатно с помощью таких инструментов, как Bing, HuggingFace, Poe и другие.

Inventive Film Editing от Runway Gen-2 (Google)

Inventive Film Editing от Runway Gen-2

В июне стартап Runway, поддерживаемый Google и предоставивший свои инструменты визуальных эффектов для создания захватывающей графики в ленте победителя премии «Оскар» «Everything Everywhere All At Once», представил свою модель Gen-2. Новая версия позволяет каждому создавать полноценные видеоролики всего лишь по текстовым подсказкам, изображениям или другим видео. Ко-основатель и генеральный директор Runway, Cristóbal Valenzuela, сравнивает новую технологию с изобретением камеры 200 лет назад. «ИИ — это новый вид камеры», — говорит он, — «который переформатирует искусство рассказа навсегда и приведет к созданию полнометражных фильмов, полностью сгенерированных».

Authentic AI от Alitheon FeaturePrint

Authentic AI от Alitheon FeaturePrint

Одним из решений проблемы фальсификации товаров на многие триллионы долларов может быть простое действие: направить камеру вашего телефона, скажем, на часы или сумку, и позволить умному программному обеспечению определить их подлинность. FeaturePrint, оптическая технология искусственного интеллекта, сначала «видит» миниатюрные детали поверхности физических предметов и создает для них «отпечатки», преобразуя их в уникальные математические идентификаторы. Затем она может сказать вам, является ли предмет подлинным или фальшивым одним нажатием кнопки. «Никакие наклейки, ярлыки или маркеры не нужны», — говорит генеральный директор Alitheon Roei Ganzarski. Одним из клиентов является Argor-Heraeus, производитель золотых слитков для национальных банков.

Eyes in the Skies от Dedrone City-Wide Drone Detection

Eyes in the Skies от Dedrone City-Wide Drone Detection

Дроны могут быть как разрушительными, так и полезными. Продукт City-Wide Drone Detection компании Dedrone создает виртуальный щит вокруг географической области, предупреждая правоохранительные органы в течение нескольких секунд, если дрон вошел в установленное воздушное пространство. Dedrone отслеживает уникальное сочетание сигналов от дронов, включая радиочастоту, данные ADS-B (также используемые в самолетах) и маячки RemoteID, чтобы определить местоположение инцидентов. Mary-Lou Smulders, главный маркетолог компании, сравнивает это с системой управления воздушным движением для дронов — чего раньше не существовало. Среди клиентов компании Con Edison, использующая эту технологию для защиты своей инфраструктуры; полиция Барселоны; и неуказанное количество аэропортов.

Master Translator от Meta SeamlessM4T

Master Translator от Meta SeamlessM4T

Meta сравнивает свою модель искусственного интеллекта SeamlessM4T с Babel Fish, универсальным переводчиком языков из «Путеводителя галактикой для путешествующих автостопом». Программное обеспечение компании способно понимать почти 100 языков как на основе речи, так и текста. Также, оно способно мгновенно переводить их в режиме реального времени в различных форматах. Например, от речи к речи, от текста к тексту, от речи к тексту или от текста к речи. Помимо работы с гораздо большим количеством языков по сравнению с предшественниками, система, по заявлению Meta, более эффективна и менее подвержена ошибкам, и даже способна расшифровывать несколько языков, смешанных в одном предложении. Помимо этого, Meta сделала модель открытой. Исходя из этого, исследователи по всему миру могут использовать ее код.

Astounding Mimicry от So-VITS-SVC

Astounding Mimicry от So-VITS-SVC

Ранее в этом году анонимный создатель, известный как Ghostwriter, вызвал сенсацию треком «Heart on My Sleeve», в котором звучали убедительные вокалы, созданные искусственным интеллектом и напоминающие Drake и Weeknd. Увы, трек быстро убрали с легальных стриминговых сервисов, однако, он успел стать вирусным. Голоса были созданы с использованием открытого программного обеспечения So-VITS-SVC, которое позволяет технически подготовленным обучать нейронную сеть на голосе певца и затем создавать любую песню с использованием созданных искусственным интеллектом вокалов. Энтузиасты обмениваются голосовыми моделями — от Bad Bunny до Taylor Swift и James Hatfield — в сообществах Discord. Тем временем появляются простые в использовании веб-сайты, использующие это программное обеспечение.

Stopping Wildfires от AlertCalifornia / Cal Fire AI Wildfire Detector

Stopping Wildfires от AlertCalifornia

Обнаружение лесных пожаров до их распространения — вызов, с которым теперь сталкивается большая часть мира. Программа общественной безопасности от Университета Калифорнии в Сан-Диего, AlertCalifornia, использует искусственный интеллект для решения этой проблемы. Совместно с Cal Fire, программа обучила искусственный интеллект обнаруживать дым и другие ранние признаки пожара на потоке данных от более чем 1050 камер, размещенных в лесах по всему штату. Когда система обнаруживает что-то подозрительное, она предупреждает местное пожарное депо посредством текстового сообщения. В первые два месяца система правильно идентифицировала 77 пожаров до поступления звонков по номеру 911. «Самые успешные случаи этой системы — это пожары, о которых вы никогда не слышите», — говорит Falco Kuester, со-руководитель AlertCalifornia.

Music Creation, Made Easy от Stable Audio

Music Creation, Made Easy от Stable Audio

С использованием мощи генеративного искусственного интеллекта Stable Audio, созданного компанией Stability AI, можно легко создавать практически любые звуки или песни с помощью нескольких простых текстовых подсказок. Введение, например, «амбиент техно, барабанная машина, спокойствие, инструментальная музыка» привело к созданию расслабляющего трека в стиле нью эйдж, который не потерял бы своей актуальности в шикарном лаундже. Также, модель обучена на наборе данных с веб-сайта со стоковой аудиозаписью (все законно!). Библиотека огромна – более 800 000 аудиофайлов, общей продолжительностью более 20 000 часов. Таким образом, данная нейросеть может использоваться как для профессиональных, так и для любительских проектов.

Animal Protector от TrailGuard AI

Animal Protector от TrailGuard AI

В некоторых регионах Индии и Африки браконьерство остается основной угрозой вымиранию слонов и больших кошек, даже в охраняемых зонах. Система TrailGuard AI была созданна организацией Resolve из США. Она использует крошечные камеры с технологией от Intel для мониторинга и выявления браконьеров среди вымирающих видов. Система передает изображения властям по сотовой связи или длиннодействующим радиосигналам всего за 30 секунд. Пользовательские модели искусственного интеллекта TrailGuard могут быть обучены распознавать не только людей, но и любые интересующие виды, от тигров до гиен. Технология привела к арестам более 30 браконьеров в ходе тестирования в Восточной Африке, и в настоящее время проводится крупномасштабное тестирование в регионе с плотной популяцией тигров в центральной Индии.

Picturing Your Imagination от OpenAI Dall-E 3

Picturing Your Imagination от OpenAI Dall-E 3

Когда OpenAI выпустил в свет ChatGPT в ноябре, это радикально изменило облик искусственного интеллекта. Компания надеется, что DALL-E 3 — новая и значительно улучшенная версия своего генератора изображений с использованием искусственного интеллекта — окажет такое же воздействие. По словам Aditya Ramesh, изобретателя DALL-E 3 в OpenAI, предыдущие генераторы изображений требуют изучения нового технического языка, включая добавление строк с минусами и числами, чтобы получить лучшие результаты. Не так с DALL-E 3, который интегрирован в ChatGPT, позволяя пользователям вводить команды в разговорной форме и получать изображение, соответствующее их описанию.

Listen Up от Project Gutenberg Open Audiobook Collection

Listen Up от Project Gutenberg Open Audiobook Collection

Project Gutenberg — самая старая цифровая библиотека, созданная в 1971 году для увеличения доступности электронных книг. Однако генеральный директор Greg Newby говорит, что она «не отличается великолепием в создании или распространении». Поэтому Microsoft и MIT объединились, чтобы создать Open Audiobook Collection. Здесь используется технология text-to-speech (текст-в-речь) для превращения 5000 книг в бесплатные синтетические аудиокниги, теперь доступные на Spotify. Программное обеспечение, используемое в проекте, также было выпущено бесплатно.

Breaking Down Beats от AudioShake

Breaking Down Beats от AudioShake

Когда одна из крупнейших рок-групп недавно заключила сделку на использование своей хитовой песни 1970-х годов в рекламе, ее участники были в восторге. Одна проблема: рекламщики хотели только инструментальную версию, а у группы был только финальный микс. Поэтому команда рокеров обратилась к AudioShake, чья программа искусственного интеллекта выделяет элементы предварительно записанного звука, разделяя его на составные части. «Мы делаем аудио интерактивным и редактируемым, делая возможными такие практические использования, которые помогают артистам зарабатывать», — говорит сооснователь и генеральный директор Jessica Powell.

Rethinking the Smartphone от Humane Ai Pin

Rethinking the Smartphone от Humane Ai Pin

Два бывших руководителя Apple, основавших компанию Humane*, представляют будущее без экранов, и Ai Pin — их первый шаг. Как только легкий Humane Ai Pin магнитно прикрепляется к вашей одежде, он становится вашим искусственным интеллектом, личным помощником. С использованием собственного программного обеспечения и GPT от OpenAI, устройство позволяет вам делать всё: от задавания сложных вопросов до совершения звонков и отправки сообщений, используя только голос. Встроенная камера может идентифицировать объекты и предоставлять контекстную информацию, такую как оценки калорий для продукта. Проминентный индикатор конфиденциальности, называемый «Лампа доверия» (Trust Light), загорается, когда камера, микрофон или сенсоры ввода Pin активны, чтобы убедиться, что все вокруг знают, когда он слушает или записывает. Таким образом, если вам нужны визуальные данные, небольшой проектор направляет их прямо на ладонь вашей вытянутой руки. Запуск устройства запланирован на 9 ноября.

 

Другие записи
Sona
Sona привлекает $27,5 млн и нацелена на расширение в США15 мая, 2024
Sona привлекает $27,5 млн и нацелена на расширение в США
Sona, платформа для управления рабочей силой для сотрудников первой линии, привлекла 27,5 миллиона долларов в...
leap ai best banner
Вышло обновление для нейросети Leap AI03 февраля, 2024
Вышло обновление для нейросети Leap AI
Недавно произошло значительное обновление в нейросети Leap AI, которое открывает новые возможности для пользователей. Теперь...