AI
Notícias IA

Estratégias para Rotulagem de Intervalos com Modelos de Linguagem de Grande Escala

Source:arXiv
Autor original:Danil Semin et al.
Estratégias para Rotulagem de Intervalos com Modelos de Linguagem de Grande Escala

Imagem gerada por Gemini AI

Pesquisas recentes revelam que os grandes modelos de linguagem (LLMs) enfrentam desafios em tarefas de análise de texto, como o reconhecimento de entidades nomeadas, devido à falta de mecanismos para referenciar segmentos de entrada. O estudo categoriza as estratégias de prompt em três tipos e apresenta o LogitMatch, um novo método que alinha as saídas do modelo com trechos de entrada válidos. As avaliações demonstram que, embora a marcação tradicional seja eficaz, o LogitMatch melhora o desempenho ao resolver problemas de correspondência de trechos, superando outras estratégias em diversas situações. Esse avanço pode aprimorar a aplicação dos LLMs na análise de texto, resultando em resultados mais precisos.

Novas Estratégias para Rotulagem de Span com Modelos de Linguagem de Grande Escala

Pesquisas recentes destacam o papel em evolução dos modelos de linguagem de grande escala (LLMs) na análise de texto, particularmente para tarefas como reconhecimento de entidades nomeadas. Um desafio notável com arquiteturas generativas é a falta de um mecanismo explícito para referenciar segmentos de entrada específicos, levando a estratégias de solicitação inconsistentes para rotulagem de span.

Introdução ao LogitMatch

Pesquisadores introduziram o LogitMatch, um novo método de decodificação restrita projetado para melhorar o alinhamento entre a saída do modelo e spans de entrada válidos. Este método oferece uma abordagem mais estruturada para a rotulagem de span, abordando problemas anteriores com técnicas baseadas em correspondência.

Avaliação em Diversas Tarefas

O estudo avalia esses métodos em quatro tarefas. Os resultados indicam que, embora a rotulagem permaneça uma base forte, o LogitMatch demonstra desempenho superior em certos contextos. Ao eliminar efetivamente problemas relacionados à correspondência de spans, o LogitMatch supera outras estratégias em vários cenários.

Tópicos relacionados:

grandes modelos de linguagemrotulagem de faixasreconhecimento de entidades nomeadasLogitMatchestratégias de prompt

📰 Fonte original: https://arxiv.org/abs/2601.16946v1

Todos os direitos e créditos pertencem ao editor original.

Compartilhar este artigo