AI
Новости ИИ

Последние новости ИИ

HexFormer: Гиперболический Vision Transformer с агрегацией по экспоненциальной карте

HexFormer: Гиперболический Vision Transformer с агрегацией по экспоненциальной карте

Исследователи разработали HexFormer — гиперболический визуальный трансформер для классификации изображений, который использует агрегацию по экспоненциальной карте в своем механизме внимания. Архитектура включает как гиперболический вариант, так и гибридную версию, сочетающую гиперболический энкодер с евклидической классификационной головой. Эксперименты показывают, что HexFormer превосходит стандартные евклидические модели и предыдущие гиперболические трансформеры по различным наборам данных, причем гибридный вариант демонстрирует наилучшие результаты. Исследование также подчеркивает, что гиперболические модели обеспечивают лучшую стабильность градиента и меньшую чувствительность к стратегиям обучения, что предполагает практические преимущества использования гиперболической геометрии для задач компьютерного зрения.

arXiv
Изучение и проверка: структура для строгой верификации нейронных сетей, основанных на физике

Изучение и проверка: структура для строгой верификации нейронных сетей, основанных на физике

Новая структура «Обучение и Проверка» решает проблемы нейронных сетей в решении дифференциальных уравнений, предоставляя вычисляемые границы ошибок. Она объединяет двойную сглаженную максимальную потерю для обучения с интервалом арифметики для верификации, что позволяет получить строгие апостериорные оценки ошибок. Успешные численные тесты на нелинейных обыкновенных дифференциальных уравнениях демонстрируют её потенциал для надежных приложений в области научного машинного обучения.

arXiv
Диффузия для деокклюзии: диффузионное инпейнтинг с учетом аксессуаров для надежного распознавания биометрических данных уха

Диффузия для деокклюзии: диффузионное инпейнтинг с учетом аксессуаров для надежного распознавания биометрических данных уха

Исследование оценивает технику восстановления ушей на основе диффузии, направленную на улучшение систем распознавания ушей, которые сталкиваются с препятствиями из-за аксессуаров, таких как серьги и наушники. Модель восстанавливает закрытые участки уха, при этом сохраняя анатомическую точность. Испытания на различных моделях визуальных трансформеров показывают, что данная техника улучшает показатели распознавания, подтверждая её практическую полезность в биометрических приложениях.

arXiv
Airtable запускает AI-агента Superagent

Airtable запускает AI-агента Superagent

Генеральный директор Airtable Хоуи Лю продолжает запуск новой продуктовой линии, несмотря на падение оценки компании на две трети. Лю считает, что эта инициатива поможет Airtable занять прочные позиции для роста и инноваций на конкурентном рынке программного обеспечения. Новые продукты нацелены на улучшение пользовательского опыта и расширение возможностей Airtable, что отражает стратегический поворот компании в условиях финансовых трудностей.

TechCrunch
Phoebe Gates и София Кианни привлекли $35 млн для проекта Phia с целью «сделать покупки снова увлекательными»

Phoebe Gates и София Кианни привлекли $35 млн для проекта Phia с целью «сделать покупки снова увлекательными»

Phia, стартап, основанный Фиби Гейтс и Софией, сосредоточен на разработке ИИ-помощника для покупок, одновременно преодолевая трудности, вызванные недавним снежным штормом в Нью-Йорке. Команда по-прежнему привержена своему проекту, подчеркивая важность адаптивности как в рабочей среде, так и в процессе разработки продукта.

TechCrunch
Космическая программа Китая представила новую открытую модель Kimi K2.5 и кодирующего агента

Космическая программа Китая представила новую открытую модель Kimi K2.5 и кодирующего агента

Китайская компания Moonshot AI, при поддержке Alibaba и HongShan, представила Kimi K2.5 — открытый ИИ-модель, способную обрабатывать текст, изображения и видео. Это достижение делает Kimi K2.5 универсальным инструментом для разработчиков, который может значительно улучшить приложения в области создания контента и мультимедийного анализа. Выпуск модели подчеркивает продолжающиеся инвестиции Китая в технологии искусственного интеллекта, направленные на укрепление его конкурентных позиций на мировом рынке.

TechCrunch
Мнения лидеров технологий и студентов о будущем искусственного интеллекта

Мнения лидеров технологий и студентов о будущем искусственного интеллекта

Статья обсуждает проблемы, связанные с управлением неопределенностью в современном быстро меняющемся мире, который характеризуется значительными политическими, технологическими, культурными и научными изменениями. Подчеркивается сложность предсказания будущих трендов и необходимость адаптивности и критического мышления в процессе принятия решений. В материале предлагается, чтобы как отдельные люди, так и организации развивали устойчивость и оставались информированными для эффективного реагирования на происходящие трансформации.

Wired
Все встать для JudgeGPT

Все встать для JudgeGPT

В своей статье Лорен Файнер исследует потенциал искусственного интеллекта для решения проблем неэффективности в юридической системе. Она подчеркивает конкретные приложения, такие как предиктивная аналитика для прогнозирования исходов дел и автоматизированный анализ документов с помощью ИИ, которые могут упростить процессы и сократить затраты. Однако автор также отмечает опасения по поводу предвзятости моделей ИИ и необходимость регуляторного контроля для обеспечения справедливости и прозрачности в судебных разбирательствах. В статье утверждается, что, хотя ИИ может повысить эффективность, важно осторожно подходить к его внедрению, чтобы не усугубить существующие неравенства.

The Verge
ctELM: Декодирование и манипулирование встраиваниями клинических испытаний с помощью языковых моделей встраивания

ctELM: Декодирование и манипулирование встраиваниями клинических испытаний с помощью языковых моделей встраивания

Исследователи разработали новую открытую платформу под названием ctELM, предназначенную для выравнивания больших языковых моделей (LLM) с эмбеддингами клинических испытаний с использованием метода Embedding Language Model (ELM). Эта платформа позволяет точно описывать и проводить сравнения клинических испытаний на основе эмбеддингов, а также генерировать убедительные аннотации испытаний, опираясь на векторы концепций, такие как возраст и пол. Реализация ctELM направлена на повышение прозрачности и генеративных возможностей в биомедицинских приложениях.

arXiv
Многоцелевое обучение с подкреплением для эффективного тактического принятия решений грузовиками в условиях дорожного движения на автомагистралях

Многоцелевое обучение с подкреплением для эффективного тактического принятия решений грузовиками в условиях дорожного движения на автомагистралях

Новая многоцелевой система обучения с подкреплением, использующая метод Proximal Policy Optimization, решает сложные задачи, связанные с компромиссами при движении по автомагистралям для тяжёлых грузовиков, балансируя безопасность, энергоэффективность и временные затраты. Она генерирует непрерывный набор парето-оптимальных политик, что позволяет гибко настраивать поведение вождения без необходимости повторного обучения. Этот адаптивный подход улучшает процесс принятия решений для автономных грузоперевозок и оценивается на масштабируемой симуляционной платформе.

arXiv
Доверять, не доверять или переключаться: надежное предпочтительное обучение с подкреплением с многоэкспертной обратной связью

Доверять, не доверять или переключаться: надежное предпочтительное обучение с подкреплением с многоэкспертной обратной связью

TriTrust-PBRL (TTP) — это новая структура, разработанная для улучшения обучения с подкреплением на основе предпочтений, которая решает проблемы, возникающие из-за различий в мнениях аннотаторов. В отличие от существующих методов, TTP обучает как модель вознаграждения, так и параметры доверия, специфичные для каждого эксперта, что позволяет ей выявлять и инвертировать недобросовестную обратную связь. Это обеспечивает значительную устойчивость, о чем свидетельствуют результаты в различных задачах, таких как MetaWorld и DM Control, где TTP превосходит текущие подходы PBRL, сохраняя высокую эффективность даже при ненадежной обратной связи. Структура работает без необходимости в детализированных характеристиках экспертов, что делает её легким дополнением к существующим системам.

arXiv
Последний AI-чип Microsoft конкурирует с аналогичными решениями от Amazon и Google

Последний AI-чип Microsoft конкурирует с аналогичными решениями от Amazon и Google

Microsoft начала развертывание своего чипа Maia 200 в своих дата-центрах. Этот новый чип предназначен для повышения вычислительных мощностей и улучшения эффективности облачных сервисов. Maia 200 нацелен на поддержку различных рабочих нагрузок, что может значительно повысить производительность приложений в области искусственного интеллекта и машинного обучения. Это обновление соответствует стратегии Microsoft по оптимизации инфраструктуры и снижению операционных затрат. Ожидаются дальнейшие подробности о показателях производительности и сроках развертывания в ближайшие недели.

The Verge