AI
Новости ИИ

Последние новости ИИ

Предварительно обученные плотные и контекстуальные векторные представления на основе диффузии

Предварительно обученные плотные и контекстуальные векторные представления на основе диффузии

Новая линейка многозначных моделей встраивания pplx-embed использует многоступенчатое контрастивное обучение на основе диффузионной предобученной архитектуры для улучшения поиска на веб-уровне. Выпущены две версии: pplx-embed-v1 для стандартных задач и pplx-embed-context-v1 для контекстных встраиваний. Последняя демонстрирует выдающиеся результаты на бенчмарке ConTEB, в то время как обе модели показывают хорошие результаты на нескольких других бенчмарках поиска и внутренних оценках, что свидетельствует об их надежности для приложений масштабного поиска.

arXiv
За пределами вознаграждений на основе VLM: Моделирование латентных вознаграждений, основанное на диффузии

За пределами вознаграждений на основе VLM: Моделирование латентных вознаграждений, основанное на диффузии

Исследователи представили DiNa-LRM — латентную модель вознаграждения на основе диффузии, которая оптимизирует обучение предпочтения непосредственно на зашумленных диффузионных состояниях. Этот подход использует откалиброванную по шуму вероятность по Тёрстону для повышения эффективности согласования. DiNa-LRM превосходит существующие системы вознаграждения на основе диффузии и конкурирует с ведущими моделью «визуальный язык», демонстрируя значительные улучшения в скорости и использовании ресурсов во время согласования модели.

arXiv
SCRAPL: Преобразование рассеяния с случайными путями для машинного обучения

SCRAPL: Преобразование рассеяния с случайными путями для машинного обучения

Исследователи представили SCRAPL (Scattering transform with Random Paths for machine Learning) — новый метод оптимизации, направленный на упрощение использования вейвлетных рассеиваний в обучении нейронных сетей. Используя стохастический подход, SCRAPL повышает эффективность совместного временного и частотного рассеяния для анализа звуковых паттернов, таких как гранулярный синтез и сопоставление с Roland TR-808. Метод включает эвристику важностного выборки, что улучшает сходимость модели и ее производительность. Код и аудиопримеры доступны в виде пакета Python, что способствует более широкому применению в задачах обработки аудио.

arXiv
Старшие инженеры, включая соучредителей, покидают xAI на фонеcontroversy

Старшие инженеры, включая соучредителей, покидают xAI на фонеcontroversy

На прошлой неделе девять инженеров, включая двух соучредителей, публично покинули компанию xAI, что может свидетельствовать о потенциальной нестабильности внутри организации. Хотя некоторые увольнения были зафиксированы ранее, недавняя волна вызывает опасения относительно курса компании и удержания талантов. Эта тенденция может повлиять на текущие проекты и уровень доверия инвесторов.

TechCrunch
CBP заключает соглашение с Clearview AI для использования технологии распознавания лиц в "тактическом целеполагании"

CBP заключает соглашение с Clearview AI для использования технологии распознавания лиц в "тактическом целеполагании"

Служба таможенного и пограничного контроля США выделила 225,000 долларов на годовую подписку на Clearview AI — программное обеспечение для распознавания лиц, которое сравнивает изображения с базой данных миллиардов фотографий, собранных из открытых источников. Это решение вызывает опасения по поводу конфиденциальности и практики наблюдения, поскольку данная технология может быть использована для идентификации людей без их согласия.

Wired
Meridian привлекла 17 миллионов долларов для обновления функциональности электронных таблиц

Meridian привлекла 17 миллионов долларов для обновления функциональности электронных таблиц

Meridian вышла из режима скрытого старта, представив новаторскую платформу на основе интегрированной среды разработки (IDE), нацеленную на улучшение финансового моделирования с помощью искусственного интеллекта. Этот инструмент сосредоточен на автоматизации сложных задач в электронных таблицах, решая распространенные проблемы неэффективности. Подход Meridian может упростить процессы финансового анализа и принятия решений для компаний, что потенциально снизит зависимость от традиционных методов работы с таблицами.

TechCrunch
Uber Eats добавляет AI-ассистента для помощи в покупках продуктов питания

Uber Eats добавляет AI-ассистента для помощи в покупках продуктов питания

В статье рассматривается новая функция, которая позволяет пользователям генерировать контент на основе текстовых или визуальных запросов. Пользователям рекомендуется проверять свои заказы перед их подтверждением, что указывает на возможные проблемы с результатами. Это подчеркивает важность внимательности пользователей при эффективном использовании инструмента.

The Verge
Обучение на многообразии: Раскрытие потенциала стандартных диффузионных трансформеров с помощью кодировщиков представлений

Обучение на многообразии: Раскрытие потенциала стандартных диффузионных трансформеров с помощью кодировщиков представлений

Новый подход, названный Riemannian Flow Matching с регуляризацией Якоби (RJF), решает проблемы сходимости в диффузионных трансформерах при генерации высококачественных выходных данных из кодировщиков представлений. Сосредоточив внимание на геодезических линиях многообразия и исправляя ошибки кривизны, RJF позволяет архитектуре DiT-B (131 млн параметров) достичь значительного значения FID — 3.37, что превосходит результаты предыдущих методов. Код доступен по предоставленной ссылке на GitHub.

arXiv
Атрибуция данных с разрешением по шагам для петлевых трансформеров

Атрибуция данных с разрешением по шагам для петлевых трансформеров

Исследователи разработали новый метод, называемый Step-Decomposed Influence (SDI), для анализа влияния отдельных обучающих примеров на трансформеры с обратной связью в процессе рекурсивных вычислений. В отличие от существующих методов, которые предоставляют единый коэффициент влияния, SDI предлагает детализированную траекторию влияния на каждом итерационном этапе. Реализованный с использованием TensorSketch, SDI избегает генерации градиентов для каждого примера, что делает его масштабируемым для моделей трансформеров. Эксперименты показывают, что SDI тесно сопоставим с традиционными методами полного градиента, при этом улучшая атрибуцию данных и интерпретируемость в задачах алгоритмического рассуждения.

arXiv
Причинность в видеодиффузорах отделима от денойзинга

Причинность в видеодиффузорах отделима от денойзинга

Разработана новая архитектура под названием Separable Causal Diffusion (SCD), которая улучшает причинно-следственные модели, применяемые в генерации видео. Отделяя временное мышление от многошаговой отрисовки кадров, SCD повышает эффективность, обеспечивая большую производительность и снижая задержки. Эксперименты показывают, что она соответствует или превосходит качество существующих моделей, что делает её многообещающим нововведением в области генеративных процессов.

arXiv
Последний релиз ядра Linux завершает эру 6.x и представляет собой подарок для администраторов облачных систем.

Последний релиз ядра Linux завершает эру 6.x и представляет собой подарок для администраторов облачных систем.

Официально вышел Linux 6.19, который предлагает улучшения производительности и поддержку нового оборудования, включая обновленные драйверы для графических процессоров и сетевых устройств. Тем временем началась разработка Linux 7.0, что предвещает новые функции и улучшения. Пользователям рекомендуется обновиться до версии 6.19 для получения последних оптимизаций и стабильности.

ZDNet
OpenAI отказывается от брендинга «io» для своего аппаратного обеспечения в области ИИ

OpenAI отказывается от брендинга «io» для своего аппаратного обеспечения в области ИИ

OpenAI объявила, что не будет использовать название "io" для своей предстоящей линии аппаратного обеспечения для искусственного интеллекта. Это решение принято в свете судебного иска о нарушении товарного знака, поданного компанией Audioio, производящей аудиоустройства. Таким образом, OpenAI стремится избежать дальнейших юридических осложнений в ходе разбирательства.

Wired