AI
Новости ИИ

STReasoner: Укрепление LLM для пространственно-временного вывода в временных рядах с помощью пространственно-ориентированного обучения с подкреплением

Source:arXiv
Оригинальный автор:Juntong Ni et al.
STReasoner: Укрепление LLM для пространственно-временного вывода в временных рядах с помощью пространственно-ориентированного обучения с подкреплением

Изображение создано Gemini AI

Исследователи представили ST-Bench — набор тестов, направленный на улучшение пространственно-временного мышления в анализе временных рядов, что критически важно для таких систем, как交通 и энергетические сети. В рамках исследования был представлен STReasoner, который объединяет временные ряды, графовые структуры и текст, достигая повышения точности на 17% до 135% при минимальных затратах по сравнению с проприетарными моделями.

STReasoner Улучшает Спатиально-Временное Рассуждение в Анализе Временных Рядов

Исследователи разработали STReasoner, новый подход, который значительно улучшает большие языковые модели (LLM) для спатиально-временного рассуждения в данных временных рядов. Это достижение закрывает критическую пробел в области, придавая приоритет рассуждательным возможностям, необходимым для принятия решений в условиях высокой ответственности в таких секторах, как управление движением и эпидемиология.

Введение ST-Bench, бенчмарка, предназначенного для оценки спатиально-временного рассуждения, включает четыре ключевых задачи: этиологическое рассуждение, идентификация сущностей, корреляционное рассуждение и прогнозирование в контексте. Эти задачи были созданы с использованием сети, основанной на стохастических дифференциальных уравнениях (SDE), что обеспечивает надежную основу для тестирования навыков рассуждения.

Метрики Производительности и Стоимость

Первоначальные эксперименты с STReasoner показывают значительные приросты точности, с улучшениями производительности в диапазоне от 17% до 135%. Эти улучшения были достигнуты при затратах всего 0.004 от стоимости, связанной с собственными моделями, подчеркивая потенциал STReasoner для широкого применения.

Модель также демонстрирует сильные способности к обобщению при применении к реальным наборам данных, что указывает на ее практическую полезность за пределами контролируемых бенчмарковых задач.

Связанные темы:

STReasonerпространственно-временное рассуждениевременные рядыалгоритм обучения с подкреплениемS-GRPO

📰 Первоисточник: https://arxiv.org/abs/2601.03248v1

Все права и авторство принадлежат первоначальному издателю.

Поделиться статьей