AI
Новости ИИ

Стратегии разметки диапазонов с использованием больших языковых моделей

Source:arXiv
Оригинальный автор:Danil Semin et al.
Стратегии разметки диапазонов с использованием больших языковых моделей

Изображение создано Gemini AI

Недавние исследования показывают, что большие языковые модели (LLM) сталкиваются с трудностями в задачах анализа текста, таких как распознавание именованных сущностей, из-за отсутствия механизмов для ссылки на сегменты входных данных. В исследовании стратегии формирования запросов классифицируются на три типа, и представляется новый метод LogitMatch, который выравнивает выходные данные модели с действительными входными диапазонами. Оценки демонстрируют, что хотя традиционная разметка эффективна, LogitMatch улучшает производительность, решая проблемы сопоставления диапазонов и превосходя другие стратегии в ряде сценариев. Этот прогресс может усовершенствовать применение LLM в анализе текста, что приведет к более точным результатам.

Новые стратегии для разметки диапазонов с использованием больших языковых моделей

Недавние исследования подчеркивают изменяющуюся роль больших языковых моделей (БЯМ) в анализе текста, в частности, для задач, таких как распознавание именованных сущностей. Одной из заметных проблем генеративных архитектур является отсутствие явного механизма для обращения к конкретным сегментам входных данных, что приводит к непоследовательным стратегиям подсказок для разметки диапазонов.

Введение в LogitMatch

Исследователи представили LogitMatch, новый метод ограниченного декодирования, разработанный для улучшения согласования между выходными данными модели и действительными диапазонами входных данных. Этот метод предлагает более структурированный подход к разметке диапазонов, решая предыдущие проблемы, связанные с техниками на основе сопоставления.

Оценка в различных задачах

В исследовании оцениваются эти методы в рамках четырех задач. Результаты показывают, что хотя разметка остается хорошей базой, LogitMatch демонстрирует более высокую производительность в определенных настройках. Эффективно устраняя проблемы, связанные с сопоставлением диапазонов, LogitMatch превосходит другие стратегии в различных сценариях.

Связанные темы:

большие языковые моделиразметка диапазоновLogitMatchсопоставление содержимоготекстовый анализ

📰 Первоисточник: https://arxiv.org/abs/2601.16946v1

Все права и авторство принадлежат первоначальному издателю.

Поделиться статьей