
Diffusions-vortrainierte dichte und kontextuelle Einbettungen
Die neue Modellfamilie pplx-embed für mehrsprachige Einbettungen nutzt ein mehrstufiges kontrastives Lernen auf einem durch Diffusion vortrainierten Backbone, um die Web-Scale-Retrieval-Fähigkeiten zu verbessern. Es wurden zwei Varianten veröffentlicht: pplx-embed-v1 für Standardaufgaben und pplx-embed-context-v1 für kontextuelle Einbettungen. Letztere glänzt im ConTEB-Benchmark, während beide Modelle auch in mehreren anderen Retrieval-Benchmarks und internen Bewertungen gute Ergebnisse erzielen. Dies weist auf ihre Zuverlässigkeit für großangelegte Suchanwendungen hin.










