Последние новости ИИ

Модели с дополненной выборкой для сопоставленных молекулярных пар в трансформациях для воссоздания интуиции медицинской химии

Исследователи разработали новую базовую модель для генерации химических аналогов с использованием сопоставленных молекулярных пар (MMPs). Эта модель позволяет создавать разнообразные переменные на основе заданных пользователем паттернов трансформации, что повышает управляемость процесса. Метод, названный MMPT-RAG, включает внешние ссылки для улучшения контекстной релевантности. Эксперименты показывают значительные улучшения в разнообразии и новизне генерируемых соединений, что делает его ценным инструментом для медицины и практического открытия лекарств.

arXiv

156 дней назад

Исследование нелинейных эффектов гашения на накопление полярного поля в Солнце с использованием нейронных сетей, основанных на физике

Новое исследование использует физически информированные нейронные сети (PINN) для анализа поведения солнечного динамо, сосредотачиваясь на том, как наклонное притупление (TQ) и широтное притупление (LQ) влияют на полярное поле Солнца и амплитуды солнечного цикла. Путем настройки параметров транспортировки исследователи установили, что подавление TQ усиливается с увеличением диффузии, в то время как LQ преобладает в условиях, доминирующих над адвекцией. Исследование уточняет взаимосвязь между эффектами TQ и LQ на накопление дипольного момента, что повышает точность прогнозов солнечных циклов. В сравнении с традиционными моделями, PINN демонстрирует снижение уровня ошибок и более эффективно захватывает нелинейные тенденции, что делает ее перспективным инструментом для будущих прогнозов солнечных циклов.

arXiv

156 дней назад

Рамки навыков агентов: Перспективы использования малых языковых моделей в промышленных условиях

Фреймворк Agent Skill, поддерживаемый GitHub Copilot, LangChain и OpenAI, демонстрирует значительный потенциал для малых языковых моделей (SLMs) в промышленных контекстах. В исследовании представлено формальное определение процесса Agent Skill и проведена оценка различных языковых моделей, что показало, что модели среднего размера (с 12 до 30 миллиардов параметров) значительно выигрывают от использования этого фреймворка. Напротив, меньшие модели сталкиваются с трудностями в выборе навыков. Примечательно, что специализированные на коде модели с размером около 80 миллиардов параметров достигают производительности закрытых решений, одновременно повышая эффективность использования графических процессоров. Эти выводы помогают оптимизировать развертывание навыков агентов в условиях, ограниченных по критериям безопасности данных и бюджета.

arXiv

156 дней назад

Крупные технологии утверждают, что генеративный ИИ спасет планету, но не предоставляют убедительных доказательств

Новый отчет Джоши, поддерживаемый экологическими организациями, показывает, что многие утверждения о экологических инициативах не имеют серьезных доказательств. Результаты ставят под сомнение обоснованность различных программ и подчеркивают необходимость более строгих данных для поддержки экологической политики. Это может повлиять на финансирование и общественное доверие к этим инициативам.

Wired

156 дней назад

Индийская лаборатория искусственного интеллекта Sarvam представила новые модели, делая ставку на жизнеспособность открытого искусственного интеллекта

Индийская лаборатория искусственного интеллекта Sarvam представила новый набор больших языковых моделей, предназначенных для того, чтобы быть меньшими и более эффективными по сравнению с существующими решениями. Этот стратегический шаг направлен на захват доли рынка у более крупных проприетарных моделей, предлагая открытые альтернативы, которые могут повысить доступность и снизить затраты для разработчиков и бизнеса.

TechCrunch

156 дней назад

Функции персонализации могут сделать большие языковые модели более согласованными

Недавние исследования поднимают тревожную проблему, связанную с крупными языковыми моделями (LLM), которые сохраняют информацию о пользователях для персонализированного взаимодействия. Исследование показывает, что, несмотря на преимущества персонализации, такие модели рискуют нарушить конфиденциальность пользователей, храня чувствительные данные. Это вызывает серьезные вопросы о безопасности данных и согласии пользователей в будущих внедрениях LLM.

Mit.edu

156 дней назад

Индия усиливает свою AI-миссию с помощью NVIDIA

Индия принимает саммит по влиянию ИИ, на котором собираются мировые лидеры и эксперты отрасли для обсуждения будущего искусственного интеллекта. В центре внимания находятся такие ключевые темы, как этическое использование ИИ, регуляторные рамки и сотрудничество между правительствами и технологическими компаниями. Среди участников мероприятия – главы государств и руководители крупных компаний в сфере ИИ, которые стремятся содействовать международному сотрудничеству и установить стандарты для разработки искусственного интеллекта.

Nvidia.com

156 дней назад

Лидерство в GPU MODE Kernel Leaderboard с NVIDIA cuda.compute

Python по-прежнему является ведущим языком для машинного обучения благодаря своей простоте и удобству, однако для достижения оптимальной производительности GPU часто требуется использовать C++ для разработки пользовательских ядер. Недавние достижения в этой области нацелены на упрощение этого процесса, позволяя разработчикам писать высокопроизводительный код для GPU непосредственно на Python, что упрощает рабочие процессы и повышает продуктивность.

Nvidia.com

157 дней назад

Как совместный дизайн аппаратного и программного обеспечения от NVIDIA обеспечил значительное увеличение производительности для суверенных моделей Sarvam AI

С ростом популярности искусственного интеллекта разработчики сталкиваются с серьезными проблемами в оптимизации больших языковых моделей (LLM) для реальных приложений. Основные вопросы заключаются в достижении необходимой производительности при управлении задержками и затратами, поскольку многие модели требуют значительных вычислительных ресурсов. Ведутся исследования по поиску решений, которые позволят сбалансировать эффективность и результативность.

Nvidia.com

157 дней назад

Зависимость от размера ансамбля методов постобработки глубокого обучения, которые минимизируют (не)справедливый балл: мотивационные примеры и доказательство концепции решения

Статья обсуждает проблемы использования скорректированного непрерывного рангового вероятностного показателя (aCRPS) для обучения ансамблевым прогнозам, особенно когда вводятся структурные зависимости между членами ансамбля. Выделяются два проблемных подхода: линейная калибровка членов и метод глубокого обучения, который может вызывать проблемы с переоценкой дисперсии. Авторы предлагают "трассировочные трансформеры", адаптируя структуру PoET для поддержания условной независимости в прогнозах. Этот метод эффективно снижает систематические смещения и улучшает надежность недельных прогнозов средней температуры от системы ECMWF, независимо от размера ансамбля (3 против 9 членов на этапе обучения; 9 против 100 в реальном времени).

arXiv

157 дней назад

Решение проблем избегания, устойчивых к параметрам, с неизвестной осуществимостью с использованием обучения с подкреплением

Недавние исследования представили метод, называемый FGE (Feasibility-Guided Exploration), который решает проблемы, связанные с применением глубокого обучения с подкреплением в задачах достижимости. FGE определяет допустимые начальные условия и разрабатывает безопасную политику, превосходя существующие методы более чем на 50% по охвату в сложных сценариях в симуляторах MuJoCo и Kinetix. Этот подход повышает уровень безопасности в задачах управления с высокой размерностью.

arXiv

157 дней назад

Улучшение сохранения семантики зданий в обучении ИИ-моделей с использованием кодировок больших языковых моделей

Новое исследование показывает, что использование встраиваний больших языковых моделей (LLM) улучшает обучение искусственного интеллекта для построения семантики в архитектурной, инженерной, строительной и эксплуатационной (AECO) отраслях. В ходе тестирования 42 подтипов строительных объектов этот подход превзошел традиционное одноразовое кодирование, а встраивание llama-3 показало среднее взвешенное значение F1-метрики на уровне 0.8766. Данный метод усиливает способность ИИ интерпретировать сложные семантические структуры, что указывает на значительный потенциал для более широкого применения в задачах AECO.

arXiv

157 дней назад