Aktuelle KI-Nachrichten

Diffusions-vortrainierte dichte und kontextuelle Einbettungen

Die neue Modellfamilie pplx-embed für mehrsprachige Einbettungen nutzt ein mehrstufiges kontrastives Lernen auf einem durch Diffusion vortrainierten Backbone, um die Web-Scale-Retrieval-Fähigkeiten zu verbessern. Es wurden zwei Varianten veröffentlicht: pplx-embed-v1 für Standardaufgaben und pplx-embed-context-v1 für kontextuelle Einbettungen. Letztere glänzt im ConTEB-Benchmark, während beide Modelle auch in mehreren anderen Retrieval-Benchmarks und internen Bewertungen gute Ergebnisse erzielen. Dies weist auf ihre Zuverlässigkeit für großangelegte Suchanwendungen hin.

arXiv

vor 163 Tagen

Über VLM-basierte Belohnungen hinaus: Diffusionsnative latente Belohnungsmodellierung

Forscher haben DiNa-LRM vorgestellt, ein diffusionsbasiertes latentes Belohnungsmodell, das das Präferenzlernen direkt auf verrauschten Diffusionszuständen optimiert. Dieser Ansatz nutzt eine rauschkalibrierte Thurstone-Wahrscheinlichkeit, um die Effizienz der Ausrichtung zu verbessern. DiNa-LRM übertrifft bestehende auf Diffusion basierende Belohnungssysteme und konkurriert mit führenden Vision-Language-Modellen, wobei signifikante Verbesserungen in Geschwindigkeit und Ressourcennutzung während der Modellanpassung erzielt werden.

arXiv

vor 163 Tagen

SCRAPL: Streuungstransform mit zufälligen Pfaden für maschinelles Lernen

Forscher haben SCRAPL (Scattering Transform with Random Paths for Machine Learning) eingeführt, eine neuartige Optimierungsmethode, die die Nutzung von Wavelet-Streuungs-Transformationen beim Training von neuronalen Netzen optimiert. Durch den Einsatz eines stochastischen Ansatzes steigert SCRAPL die Effizienz der gemeinsamen Zeit-Frequenz-Streuungs-Transformationen zur Analyse von Klangmustern, beispielsweise in der granularen Synthese und beim Abgleich mit dem Roland TR-808. Die Methode beinhaltet eine Heuristik für die Wichtigkeitsstichprobe, um die Konvergenz und Leistung des Modells zu verbessern. Der dazugehörige Code und Audiobeispiele sind als Python-Paket verfügbar, was eine breitere Anwendung in Aufgaben der Audiobearbeitung ermöglicht.

arXiv

vor 163 Tagen

Senior Engineers, einschließlich Mitbegründer, verlassen xAI inmitten von Kontroversen

In der vergangenen Woche haben neun Ingenieure, darunter zwei Mitgründer, xAI öffentlich verlassen, was auf mögliche Instabilität im Unternehmen hindeutet. Während einige Abgänge bereits früher vermerkt wurden, wirft die jüngste Welle Bedenken hinsichtlich der Richtung der Firma und der Bindung von Talenten auf. Dieser Trend könnte sich negativ auf laufende Projekte und das Vertrauen der Investoren auswirken.

TechCrunch

vor 163 Tagen

CBP schließt Vertrag mit Clearview AI zur Nutzung von Gesichtserkennung für „taktische Zielverfolgung“ ab

Die US-Zoll- und Grenzschutzbehörde hat 225.000 US-Dollar für ein einjähriges Abonnement von Clearview AI bereitgestellt, einer Gesichtserkennungssoftware, die Bilder mit einer Datenbank von Milliarden öffentlich zugänglicher Fotos abgleicht. Diese Entscheidung wirft Bedenken hinsichtlich der Privatsphäre und der Überwachungspraktiken auf, da die Technologie verwendet werden könnte, um Personen ohne deren Zustimmung zu identifizieren.

Wired

vor 163 Tagen

Meridian sammelt 17 Millionen Dollar zur Neugestaltung der agentischen Tabelle

Meridian hat den Stealth-Modus verlassen und eine innovative IDE-basierte Plattform vorgestellt, die darauf abzielt, die Finanzmodellierung durch den Einsatz von KI zu verbessern. Dieses Tool konzentriert sich auf die Automatisierung komplexer Tabellenkalkulationsaufgaben und behebt damit gängige Ineffizienzen. Der Ansatz von Meridian könnte die Finanzanalyse und Entscheidungsfindung in Unternehmen optimieren und möglicherweise die Abhängigkeit von traditionellen Tabellenkalkulationsmethoden verringern.

TechCrunch

vor 163 Tagen

Uber Eats führt KI-Assistenten zur Unterstützung beim Lebensmitteleinkauf ein

Der Artikel behandelt ein neu eingeführtes Feature, das es Nutzern ermöglicht, Inhalte mithilfe von Text- oder Bildvorgaben zu generieren. Den Nutzern wird geraten, ihre Bestellungen vor der endgültigen Bestätigung zu überprüfen, da potenzielle Probleme mit den Ergebnissen auftreten können. Dies unterstreicht die Bedeutung der Sorgfalt der Benutzer bei der effektiven Nutzung des Tools.

The Verge

vor 164 Tagen

Lernen auf dem Mannigfaltigen: Entschlüsselung standardisierter Diffusions-Transformer mit Repräsentations-Encodern

Ein neuer Ansatz namens Riemannian Flow Matching mit Jacobi-Regularisierung (RJF) geht Konvergenzprobleme in Diffusions-Transformern an, die bei der Generierung von hochqualitativen Ausgaben aus Repräsentationscodierern auftreten. Durch die Fokussierung auf Mannigfaltigkeits-Geodäten und die Korrektur von Krümmungsfehlern ermöglicht es RJF der DiT-B-Architektur (131 Millionen Parameter), einen signifikanten FID-Wert von 3,37 zu erreichen, was eine Verbesserung gegenüber vorherigen Methoden darstellt. Der Code ist unter dem angegebenen GitHub-Link verfügbar.

arXiv

vor 164 Tagen

Schrittweise aufgelöste Datenattribution für geschlossene Transformatoren

Forscher haben eine neue Methode namens Step-Decomposed Influence (SDI) entwickelt, um zu analysieren, wie einzelne Trainingsbeispiele während wiederkehrender Berechnungen die Leistung von Transformer-Modellen beeinflussen. Im Gegensatz zu bestehenden Methoden, die nur einen einzelnen Einflusswert liefern, bietet SDI eine detaillierte Einflusskurve für jede Iteration. Die Implementierung erfolgt mithilfe von TensorSketch, wodurch die Berechnung von gradientspezifischen Einflüssen pro Beispiel entfällt und die Methode für Transformer-Modelle skalierbar bleibt. Experimentelle Ergebnisse zeigen, dass SDI eng mit traditionellen Vollgradientenmethoden übereinstimmt und gleichzeitig die Datenattribution sowie die Interpretierbarkeit in algorithmischen Entscheidungsprozessen verbessert.

arXiv

vor 164 Tagen

Kausalität in Video-Diffusoren ist von der Rauschunterdrückung trennbar

Eine neue Architektur, die als Separable Causal Diffusion (SCD) bezeichnet wird, wurde entwickelt, um die kausalen Diffusionsmodelle für die Videogenerierung zu verbessern. Durch die Entkopplung des zeitlichen Denkens von der mehrstufigen Bilddarstellung steigert SCD die Effizienz und erreicht eine höhere Durchsatzrate bei gleichzeitig verringerter Latenz. Experimentelle Ergebnisse zeigen, dass es die Qualität bestehender Modelle erreicht oder sogar übertrifft, was es zu einer vielversprechenden Innovation im Bereich der generativen Prozesse macht.

arXiv

vor 164 Tagen

Die neueste Linux-Kernel-Version beendet die 6.x-Ära und bietet Vorteile für Cloud-Administratoren.

Linux 6.19 wurde offiziell veröffentlicht und bietet Verbesserungen in der Leistung sowie Unterstützung für neue Hardware, darunter aktualisierte Treiber für GPUs und Netzwerktechnologien. Gleichzeitig hat die Entwicklung von Linux 7.0 begonnen, was auf bevorstehende Funktionen und Optimierungen hinweist. Nutzer werden ermutigt, auf Version 6.19 umzusteigen, um von den neuesten Optimierungen und der verbesserten Stabilität zu profitieren.

ZDNet

vor 164 Tagen

OpenAI gibt 'io'-Markenbezeichnung für seine KI-Hardware auf

OpenAI hat angekündigt, den Namen „io“ für seine bevorstehende Hardware-Linie im Bereich Künstliche Intelligenz nicht zu verwenden. Dieser Schritt erfolgt im Zusammenhang mit einer Klage wegen Markenrechtsverletzung, die von dem Audiogerätehersteller Audioio eingereicht wurde. Mit dieser Entscheidung möchte OpenAI rechtliche Komplikationen vermeiden, während der Fall weiterhin vor Gericht verhandelt wird.

Wired

vor 164 Tagen