Итоги недели в мире ИИ и обзоры новых сервисов: ИИ оцифровал и напечатал запах

Итоги недели в мире ИИ и обзоры новых сервисов: ИИ оцифровал и напечатал запах

📰 Новости

По данным отчета Octoverse 2024, Python обогнал JavaScript (бессменного чемпиона в течение 10 лет!) и стал самым популярным языком на GitHub. Среди других важных трендов 2024 года оказались:

  • Стремительный рост популярности Jupyter Notebook (92%) в связи с беспрецедентным уровнем интереса к Data Science и машинному обучению.
  • Феноменальный приток новых разработчиков, в особенности ИИ-специалистов.
  • Увеличение количества коммитов на 98%, в том числе в ИИ-проекты – на 59%.
Python вышел в лидеры благодаря стремительному развитию ИИ
Python вышел в лидеры благодаря стремительному развитию ИИ

Электрического робота Atlas (Boston Dynamics) научили действовать автономно, адаптируясь к изменениям в реальном времени.

OpenAI разработала каверзный бенчмарк SimpleQA, который не слишком высоко оценил собственные модели компании: GPT-o1 набрала 42,7%, GPT-4-o38,2%, а GPT-4o mini8%. Лучшая модель главного конкурента OpenAI, Claude 3.5 Sonnet от Anthropic, правильно ответила всего лишь на 28,9% вопросов. Бенчмарк содержит 4326 вопросов из самых разных областей – от науки до искусства – и, помимо простого подсчета правильных и неправильных ответов, способен оценить степень уверенности, с которой ИИ-модели выдают ответы. Оказалось, что большинство моделей сильно преувеличивают свои способности. Это объясняет, почему некоторые из них уверенно выдают абсурдные советы вроде использования клея для закрепления сыра на пицце.

Github Copilot теперь поддерживает модели Gemini и Claude. Кроме того, на платформе появилась новая фича – Spark для создания и расшаривания микроприложений. Навыки программирования для использования Spark не требуются.

Привет!

Мы запустили еженедельную email-рассылку, посвященную последним новостям и тенденциям в мире искусственного интеллекта. Наша цель – держать подписчиков в курсе самых интересных открытий, исследований и приложений ИИ.

В еженедельных письмах ты найдешь:

  • Новости о прорывных исследованиях в области машинного обучения и нейросетей.
  • Материалы о применении ИИ в разных сферах – медицине, бизнесе, науке, производстве и образовании.
  • Статьи об этических аспектах развития технологий.
  • Подборки лучших онлайн-курсов и видеолекций по машинному обучению.
  • Обзоры инструментов и библиотек для разработки нейронных сетей.
  • Ссылки на репозитории с открытым исходным кодом ИИ-проектов.
  • Фильмы, сериалы и книги, которые заслуживают внимания AI-энтузиастов.

Гендиректор Google/Alphabet Сундар Пичаи сообщил, что уже больше 25% кода в компании генерирует ИИ.

Meta* объявила о начале некоммерческого сотрудничества с правительством США. Главная цель компании – сделать Llama* стандартным ИИ-инструментом для реализации любых правительственных инициатив: от упрощения процедуры получения кредитов на образование до поддержки малого бизнеса.

Платформа LinkedIn запустила первого ИИ-ассистента для подбора сотрудников.

Стартапу Osmo впервые в истории удалось оцифровать запах: созданная компанией ИИ-система уловила в воздухе молекулы аромата сливы и напечатала результат в виде прозрачной жидкости. Технический процесс включает в себя три компонента:

  • Газовую хроматографию.
  • Масс-спектрометрию.
  • ИИ-анализ для создания цифрового «отпечатка» запаха.

Это открытие поможет оснастить компьютеры системой цифрового обоняния и многократно упростит процесс создания новых ароматических композиций для косметической и пищевой промышленности.

Исследователи Института психиатрии, психологии и нейронаук в Королевском колледже Лондона обнаружили, что общение с ИИ-аватарами оказывает положительное терапевтическое влияние на пациентов со слуховыми галлюцинациями.

🤖🦾 Больше полезных материалов вы найдете на нашем телеграм-канале «Библиотека робототехники и беспилотников | Роботы, ИИ, интернет вещей»

Proglib.io

Специалистов ServeTheHome пригласили посетить Colossus Илона Маска. Так выглядит крупнейший на сегодняшний день ИИ-кластер в мире:

Галлюцинации модели Whisper (OpenAI) для транскрибации аудио вызвали массу недоразумений в американских госпиталях: LLM выдумывает несуществующие болезни, вставляет расистские и агрессивные замечания, заполняет паузы в разговорах бессмысленными рассуждениями и добавляет типичные фразы из YouTube-роликов вроде «Спасибо за просмотр».

Чат-бот Claude.ai научился анализировать и визуализировать данные из CSV-файлов.

Для анализа данных Claude пишет и выполняет JavaScript-код прямо в чате

Загадочная модель для генерации изображений Red Panda молниеносно обошла старожилов на всех лидербордах.

По качеству и скорости генераций Red Panda превосходит Midjourney, Flux и DALL-E 3
По качеству и скорости генераций Red Panda превосходит Midjourney, Flux и DALL-E 3

Автономный ИИ-художник Botto продал очередной NFT-арт на аукционе «Сотбис» за $351 600. Всего за 3 года Botto продал артов на $4 млн.

🤖🎨 Больше полезных материалов вы найдете на нашем телеграм-канале «Библиотека нейрокартинок | Midjourney, DALL-E, Stable Diffusion»

Proglib.io

🧱 Инструменты

Mapify – выполняет суммаризацию любого контента и визуализирует результат в виде ментальных карт.

Storm – превращает материалы ваших исследований в готовые вики-статьи.

Keak – ИИ-агент, способный непрерывно улучшать ваш сайт: самостоятельно создает A/B-тесты, анализирует результаты, внедряет новую функциональность.

Latitude – платформа для создания, тестирования и улучшения промптов.

Sourcely – находит академические источники для исследований и научных работ: у Google Scholar пока нет такой фичи.

Bolt – разрабатывает и редактирует фулстек-приложения, поддерживает все популярные JavaScript-фреймворки и библиотеки.

🤖🔊 Больше полезных материалов вы найдете на нашем телеграм-канале «Библиотека нейрозвука | Транскрибация, синтез речи, ИИ-музыка»

Proglib.io

TavusИИ-двойники, способные слышать, видеть и говорить. Аналогичная технология – Proxy.

MyAudioJournalаудиодневник, который поможет разобраться в себе.

timeOSИИ-компаньон для повышения продуктивности.

Reflect Webchat – Chrome-расширение для чата с любыми веб-страницами и транскриптами YouTube-клипов.

Wand – превращает наброски в готовые арты в нужном стиле.

Smashing – рекомендует качественные статьи и подкасты, соответствующие вашим интересам.

🤖✍ Больше полезных материалов вы найдете на нашем телеграм-канале «Библиотека нейротекста | ChatGPT, Gemini, Bing»

Proglib.io

🏗 Сделай сам

OmniGen – универсальная модель для генерации изображений с впечатляющими возможностями:

  • Генерация с сохранением внешности персонажа в серии фотографий.
  • Редактирование существующих изображений.
  • Генерация на основе нескольких референсов.
  • Автоматическое распознавание нужных элементов в изображениях (объекты, позы людей, карты глубины) без дополнительных плагинов.
Некоторые из возможностей OmniGen
Некоторые из возможностей OmniGen

Clevrr Computer – опенсорсная версия ИИ-системы, которая позволяет Claude управлять компьютером.

NotebookLlama* – опенсорсная версия NotebookLM от Google. Еще один аналог – Open NotebookLM, протестировать можно на Hugging Face (поддерживает русский язык).

CuPy – NumPy/SciPy-совместимая библиотека для выполнения вычислений на GPU.

Moshi – модель для голосового чата в реальном времени.

MemoRAG – инновационная RAG-платформа с поддержкой суперобъемной памяти. В отличие от стандартных систем RAG, которые обрабатывают запросы с конкретным ограниченным контекстом, MemoRAG использует свою модель памяти для достижения глобального понимания всей базы данных.

🤖🎥 Больше полезных материалов вы найдете на нашем телеграм-канале «Библиотека нейровидео | Sora AI, Runway ML, дипфейки»

Proglib.io

SurfSense – сохраняет информацию из разных онлайн-источников и личных файлов в векторной базе, с которой можно общаться.

gptmeИИ-агент, работающий в терминале. Может делать все, что на данный момент можно ожидать от агента: пишет и запускает код, серфит в интернете, манипулирует локальными файлами, работает с репозиториями, понимает содержимое скриншотов и веб-страниц.

exo – позволяет запустить домашний ИИ-кластер на любых подручных гаджетах, включая Raspberry Pi, смартфоны и планшеты, без GPU.

TANGO – опенсорсный аналог HeyGen: создает суперреалистичные видео на основе аудио и видео референсов.

Pyramid Flow генерирует видео на основе изображения. Демо на Hugging Face.

* Meta и все ее продукты, включая NotebookLlama и Llama, признаны экстремистскими и запрещены на территории РФ.

Автор рассылки: Наталья Кайда

22
1 комментарий

А где же охренительная новость, что в Suno появились персоны?

Ответить