AI
Новости ИИ

Последние новости ИИ

Данные пан-феномики на основе глубокого обучения раскрывают стремительную эволюцию визуального разнообразия у птиц

Данные пан-феномики на основе глубокого обучения раскрывают стремительную эволюцию визуального разнообразия у птиц

Недавнее исследование применяет методы глубокого обучения, в частности модель ResNet34, для анализа эволюции морфологии птиц, распознавая более 10,000 видов. Результаты показывают, что высокоразмерное эмбеддинг-пространство модели захватывает фенотипическую конвергенцию и морфологическое разнообразие, связанные с богатством видов, подчеркивая, что именно это богатство является ключевым фактором расширения морфопространства. Паттерны, наблюдаемые после массового вымирания в конце мелового периода, демонстрируют "ранний всплеск" разнообразия. Примечательно, что исследование также акцентирует внимание на способности модели формировать иерархические структуры в контексте обучения с плоскими метками, ставя под сомнение предположения о зависимости сверточных нейронных сетей от местных текстур.

arXiv
SymPlex: Структурно-осознанный трансформер для решения символьных уравнений в частных производных

SymPlex: Структурно-осознанный трансформер для решения символьных уравнений в частных производных

SymPlex представляет собой новую framework для обучения с подкреплением, предназначенную для получения аналитических решений частных дифференциальных уравнений (ЧДУ) без необходимости в данных истинного значения. В ее основе лежит трансформер, обладающий структурной осведомленностью, под названием SymFormer, который оптимизирует решения, опираясь исключительно на ЧДУ и его граничные условия. Такой подход позволяет получать интерпретируемые решения, эффективно справляющиеся с нес гладкими поведением, что является значительным шагом вперед по сравнению с традиционными численными методами. Эмпирические испытания показывают, что SymPlex точно восстанавливает сложные решения ЧДУ, подчеркивая его потенциал для практического применения в математическом моделировании и инженерии.

arXiv
Эффективное быстро-медленное обучение многомодальных больших языковых моделей с помощью обрезки визуальных токенов

Эффективное быстро-медленное обучение многомодальных больших языковых моделей с помощью обрезки визуальных токенов

Исследователи разработали DualSpeed — фреймворк, который повышает эффективность обучения мультимодальных больших языковых моделей (MLLM) за счет устранения недостатков, связанных с огромными размерами моделей и визуальными токенами. DualSpeed использует подход с двумя режимами: быстрый режим, который применяет метод сокращения визуальных токенов (Visual Token Pruning, VTP) для уменьшения количества визуальных токенов, и медленный режим, который обучается на полных последовательностях для обеспечения согласованности. Этот метод значительно ускоряет процесс обучения — на 2,1 раза для LLaVA-1.5 и на 4,0 раза для LLaVA-NeXT — при сохранении более 99% производительности. Исходный код доступен на GitHub.

arXiv
Dassault Systèmes и NVIDIA объединяются для создания промышленной платформы искусственного интеллекта, управляющей виртуальными двойниками

Dassault Systèmes и NVIDIA объединяются для создания промышленной платформы искусственного интеллекта, управляющей виртуальными двойниками

Новая архитектура совместного промышленного ИИ интегрирует виртуальные двойники с масштабируемой инфраструктурой ИИ, что значительно улучшает принятие решений в реальном времени в производстве. Эта модель, подтвержденная научными исследованиями, оптимизирует процессы, позволяя отраслям использовать ИИ для предиктивного обслуживания и повышения операционной эффективности. Архитектура утверждает, что промышленный ИИ становится важным инструментом в современных производственных условиях.

Nvidia.com
Даррен Аронофски: ваш искусственный интеллект разрушает американскую историю в 'В этот день... 1776'

Даррен Аронофски: ваш искусственный интеллект разрушает американскую историю в 'В этот день... 1776'

Новая короткометражная серия "В этот день…1776" начинается с трогательного изображения руки, касающейся титульного листа книги Томаса Пейна "Здравый смысл", подчеркивая ее историческую значимость. Эта серия стремится исследовать ключевые события Американской революции, предоставляя контекст и понимание идей и личностей, оказавших влияние на этот период.

CNET
Почему все больше потребителей предпочитают покупки с использованием ИИ, но при этом ожидают человеческого участия

Почему все больше потребителей предпочитают покупки с использованием ИИ, но при этом ожидают человеческого участия

Недавний отчет ZDNET показывает, что 73% потребителей используют чат-ботов на базе ИИ для поиска продуктов, что свидетельствует о растущем тренде в электронной коммерции. В статье подчеркивается необходимость внедрения AI-решений компаниями для повышения вовлеченности клиентов и оптимизации процесса покупок, поскольку зависимость потребителей от этих технологий продолжает возрастать.

ZDNet
SpaceX официально приобретает xAI, основанную Илоном Маском, с планами по строительству дата-центров в космосе

SpaceX официально приобретает xAI, основанную Илоном Маском, с планами по строительству дата-центров в космосе

SpaceX объявила о приобретении стартапа ИИ Илона Маска, xAI, что стало значительным шагом в расширении компании в области искусственного интеллекта. Это слияние укрепляет позиции SpaceX как самой ценной частной компании в мире. Цель интеграции — использовать технологии xAI для улучшения операций и процессов принятия решений в SpaceX, что, в свою очередь, может упростить реализацию её амбициозных проектов по исследованию космоса.

TechCrunch
HHS использует инструменты ИИ от Palantir для нацеливания на «DEI» и «гендерную идеологию» в грантах

HHS использует инструменты ИИ от Palantir для нацеливания на «DEI» и «гендерную идеологию» в грантах

Министерство здравоохранения и социальных служб США с марта использует инструменты искусственного интеллекта от компании Palantir для улучшения процессов проверки и аудита грантов и описаний вакансий. Эта инициатива направлена на обеспечение соблюдения федеральных норм и повышение эффективности контроля. Ожидается, что интеграция этих инструментов ИИ поможет оптимизировать операции и снизить количество ошибок в управлении грантами.

Wired
PixelGen: Диффузия пикселей превосходит латентную диффузию с использованием перцептивной потери

PixelGen: Диффузия пикселей превосходит латентную диффузию с использованием перцептивной потери

PixelGen — это новая платформа для диффузии пикселей, которая преодолевает ограничения традиционных двустадийных латентных моделей диффузии, оптимизируя непосредственно в пиксельном пространстве. Она использует две перцептивные потери — LPIPS для локальных паттернов и DINO для глобальной семантики — чтобы улучшить качество изображений. PixelGen достигает конкурентоспособного значения FID в 5.11 на ImageNet-256 всего за 80 эпох обучения и демонстрирует высокую эффективность в масштабных задачах текст-к-изображению, о чем свидетельствует балл GenEval в 0.79. Этот подход исключает необходимость в вариационных автоэнкодерах и вспомогательных этапах, предлагая упрощенную и эффективную генеративную модель. Полный код доступен на GitHub.

arXiv
Расширение возможностей обучения с подкреплением с помощью текстовой обратной связи

Расширение возможностей обучения с подкреплением с помощью текстовой обратной связи

Недавнее исследование представляет метод RL from Text Feedback (RLTF), который использует текстовые отзывы для улучшения больших языковых моделей после их обучения. В отличие от традиционных подходов, RLTF применяет многоходовое обучение с подкреплением, что позволяет моделям усваивать обратную связь без необходимости в обширных демонстрациях. Были протестированы две техники — самоотдача и моделирование обратной связи — на различных задачах, и они последовательным образом превзошли существующие базовые модели, что свидетельствует о том, что текстовые отзывы могут значительно улучшить эффективность работы моделей.

arXiv
Многоhead автоматическая сегментация с использованием детектирующей головы в контекстном слоевом нейронном сети

Многоhead автоматическая сегментация с использованием детектирующей головы в контекстном слоевом нейронном сети

Новая архитектура многоуровневого трансформера с гейтированием, основанная на модели Swin U-Net, улучшает автоматическую сегментацию в радиотерапии, интегрируя контекст между срезами и параллельную детекцию. Эта модель эффективно снижает количество ложноположительных результатов, достигая среднего значения Dice loss в $0.013 \pm 0.036$ по сравнению с $0.732 \pm 0.314$ для традиционных методов. Данное достижение повышает надежность автоматического контурирования в клинической практике.

arXiv
Оптимизация коммуникации для обучения с использованием смеси экспертов с гибридным параллелизмом экспертов

Оптимизация коммуникации для обучения с использованием смеси экспертов с гибридным параллелизмом экспертов

Недавнее исследование подчеркивает сложности, связанные с внедрением Expert Parallel (EP) коммуникации в гипермасштабных моделях смешанных экспертов (MoE) в процессе обучения. Коммуникационная модель требует подхода «все со всеми», что усложняется динамикой и разреженностью. Результаты показывают, что повышение эффективности EP-коммуникации имеет решающее значение для оптимизации работы MoE, что может существенно сократить время обучения и улучшить использование ресурсов в крупномасштабных средах машинного обучения.

Nvidia.com