
Предварительно обученные плотные и контекстуальные векторные представления на основе диффузии
Новая линейка многозначных моделей встраивания pplx-embed использует многоступенчатое контрастивное обучение на основе диффузионной предобученной архитектуры для улучшения поиска на веб-уровне. Выпущены две версии: pplx-embed-v1 для стандартных задач и pplx-embed-context-v1 для контекстных встраиваний. Последняя демонстрирует выдающиеся результаты на бенчмарке ConTEB, в то время как обе модели показывают хорошие результаты на нескольких других бенчмарках поиска и внутренних оценках, что свидетельствует об их надежности для приложений масштабного поиска.










