AI
Новости ИИ

Последние новости ИИ

Diffusion-DRF: Дифференцируемый поток вознаграждения для тонкой настройки диффузионного видео

Diffusion-DRF: Дифференцируемый поток вознаграждения для тонкой настройки диффузионного видео

Оптимизация преференций с помощью прямого подхода (DPO) улучшает генерацию видео из текста, но сталкивается с проблемами, связанными с обучением, требующим большого объема меток, и предвзятостью. Предложенный метод Diffusion-DRF использует замороженную модель «Визуальный-языковой» как дифференцируемый критик, что позволяет эффективно передавать обратную связь через модели диффузии видео. Этот подход повышает качество видео и семантическое соответствие, одновременно снижая проблемы с манипуляцией наградами. Кроме того, он адаптируется к другим задачам на основе диффузии без необходимости в дополнительных моделях наград.

arXiv
Фокус на активации управления для контекстной достоверности в крупных языковых моделях

Фокус на активации управления для контекстной достоверности в крупных языковых моделях

ContextFocus — это новый подход, разработанный для повышения контекстуальной достоверности больших языковых моделей (LLMs) в условиях противоречивой информации. Он не требует дообучения модели и добавляет минимальные затраты во время инференса, что делает его эффективным. В испытаниях на бенчмарке ConFiQA в сравнении с ведущими методами ContextFocus демонстрирует значительные улучшения в точности выводов и сохраняет свою эффективность даже при использовании более крупных моделей. Это достижение предлагает практическое решение для развертывания LLM в динамичных средах знаний.

arXiv

Джейк Салливан недоволен тем, что Трамп разрушил его внешнюю политику в области ИИ

Джейк Салливан, советник президента Байдена по национальной безопасности, якобы испытывает разочарование из-за решений бывшего президента Трампа, которые, по его мнению, подорвали внешнюю политику США в сфере искусственного интеллекта. Среди ключевых действий можно выделить попытки Салливана предотвратить продажу компании Nvidia передовых чипов в Китай, что подчеркивает продолжающееся напряжение вокруг экспорта технологий и национальной безопасности.

The Verge
Mobileye приобретает стартап по разработке гуманоидных роботов Mentee Robotics за 900 миллионов долларов

Mobileye приобретает стартап по разработке гуманоидных роботов Mentee Robotics за 900 миллионов долларов

Mobileye, лидер в области технологий компьютерного зрения, стал ключевым поставщиком для автопроизводителей, поставляя миллионы чипов, которые улучшают системы безопасности и помощи водителю. В последнее время компания расширяет свой ассортимент, включая более продвинутые решения для автономного вождения. Этот переход имеет решающее значение, поскольку автомобильная отрасль все больше акцентирует внимание на возможностях самоуправляемых автомобилей. Mobileye стремится использовать свой опыт в области искусственного интеллекта и машинного обучения, чтобы соответствовать меняющимся требованиям рынка и сохранять свои конкурентные преимущества.

TechCrunch

Grok раздевает детей — сможет ли закон это остановить?

Статья обсуждает юридические вызовы, связанные с созданием сексуализированных изображений детей с помощью искусственного интеллекта, сосредотачиваясь на платформе Grok. В ней подчеркивается сложность применения законов против такого контента из-за неопределенности в существующем законодательстве и стремительного развития технологий ИИ. Последствия для согласия и безопасности детей являются значительными, поскольку действующие законы часто отстают от технологических новшеств, оставляя пробелы, которые могут быть использованы в корыстных целях. Автор призывает к более четким регуляциям для эффективного решения этих новых проблем.

The Verge
STReasoner: Укрепление LLM для пространственно-временного вывода в временных рядах с помощью пространственно-ориентированного обучения с подкреплением

STReasoner: Укрепление LLM для пространственно-временного вывода в временных рядах с помощью пространственно-ориентированного обучения с подкреплением

Исследователи представили ST-Bench — набор тестов, направленный на улучшение пространственно-временного мышления в анализе временных рядов, что критически важно для таких систем, как交通 и энергетические сети. В рамках исследования был представлен STReasoner, который объединяет временные ряды, графовые структуры и текст, достигая повышения точности на 17% до 135% при минимальных затратах по сравнению с проприетарными моделями.

arXiv
Мультирегиональный синтетический набор радиологических отчетов Multi-RADS и сравнительное тестирование 41 открытых и проприетарных языковых моделей

Мультирегиональный синтетический набор радиологических отчетов Multi-RADS и сравнительное тестирование 41 открытых и проприетарных языковых моделей

Исследователи разработали RXL-RADSet, набор эталонных данных, состоящий из 1,600 синтетических радиологических отчетов, с целью улучшения автоматической классификации RADS. В рамках исследования была проведена сравнение 41 малой языковой модели (SLM) с GPT-5.2 по критериям точности и валидности. GPT-5.2 достиг 99.8% валидности и 81.1% точности, что превзошло результаты SLM, которые показали 96.8% валидности и 61.1% точности. Производительность улучшалась с увеличением размера модели и использованием направленных подсказок, однако остаются сложности с более сложными структурами RADS.

arXiv
Момент сонара: Бенчмаркинг аудио-языковых моделей в аудио геолокации

Момент сонара: Бенчмаркинг аудио-языковых моделей в аудио геолокации

Введение AGL1K представляет собой значительный шаг вперёд в области аудио-геолокации, устанавливая новый стандарт с 1 444 отобранными аудиофрагментами из 72 стран. Используя метрику аудиолокализуемости, исследователи повысили качество записей для оценки. Результаты показывают, что закрытые аудиоязыковые модели превосходят свои открытые аналоги, при этом лингвистические подсказки играют ключевую роль в предсказаниях. Этот эталон может улучшить геопространственное мышление в аудиоязыковых моделях, устраняя предыдущие ограничения в аудиобазированной локализации.

arXiv
Главные анонсы Nvidia на CES 2026

Главные анонсы Nvidia на CES 2026

Статья посвящена вкладу Веры Рубин в астрономию, особенно её исследованиям тёмной материи, а также достижениям в области автономного вождения. Кроме того, в ней обсуждаются последние обновления программного обеспечения для геймеров на ПК, которые улучшают производительность и безопасность. Эти обновления предполагают улучшение игрового опыта и повышение стабильности системы для пользователей.

The Verge
На CES 2026 представлен двухногий Roborock, который меняет рынок роботов-пылесосов

На CES 2026 представлен двухногий Roborock, который меняет рынок роботов-пылесосов

Скоро на рынке появится Roborock Saros Rover — первый в мире двухногий робот-пылесос, созданный для повышения маневренности и эффективности уборки. В отличие от традиционных пылесосов, он способен преодолевать лестницы и различные виды покрытий, что может изменить привычные методы уборки в домах. Уникальный дизайн устройства нацелен на решение распространенных проблем, с которыми сталкиваются современные робот-пылесосы.

ZDNet
Commonwealth Fusion Systems устанавливает магнит для реактора и заключает сделку с Nvidia

Commonwealth Fusion Systems устанавливает магнит для реактора и заключает сделку с Nvidia

Компания Commonwealth Fusion Systems успешно установила первый магнит в своем реакторе термоядерного синтеза Sparc, который был представлен на выставке CES 2026. Этот этап является ключевым, поскольку CFS планирует запустить реактор в 2027 году. Устройство предназначено для продвижения технологий термоядерной энергетики, что может кардинально изменить подход к производству чистой энергии.

TechCrunch
Сенсоры на основе ИИ открывают новые возможности для раннего выявления рака

Сенсоры на основе ИИ открывают новые возможности для раннего выявления рака

Исследователи из MIT и Microsoft разработали инструмент на основе ИИ, который улучшает раннюю диагностику рака, анализируя данные пациентов и выявляя биомаркеры. Эта технология нацелена на значительное повышение точности диагностики, что может привести к более раннему вмешательству и улучшению результатов лечения. Первые испытания показывают обнадеживающие результаты, указывая на то, что она может стать настоящим прорывом в онкологической помощи.

Mit.edu