Apprendimento Profondo Stocastico: Un Quadro Probabilistico per la Modellazione dell'Incertezza nei Dati Temporali Strutturati

Immagine generata da Gemini AI
L'articolo presenta l'Inferenzia Differenziale Stocastica Latente (SLDI), un framework che combina equazioni differenziali stocastiche (SDE) e modelli generativi profondi per migliorare la quantificazione dell'incertezza nel machine learning. Integrando un SDE di Itô nello spazio latente di un autoencoder variazionale, SLDI supporta la modellazione in tempo continuo e utilizza reti neurali per parametrizzare i componenti delle SDE. Questo approccio affronta il problema del campionamento irregolare dei dati mantenendo un rigoroso fondamento matematico. Le principali innovazioni includono un sistema accoppiato di dinamiche latenti e gradienti in avanti e all'indietro, insieme a una perdita aggiuntiva regolarizzata in modo pathwise per stabilizzare l'addestramento negli SDE latenti profondi, aprendo la strada a progressi nel machine learning probabilistico stocastico.
Progressi nella Quantificazione dell'Incertezza con il Framework di Deep Learning Stocastico
È stato proposto un nuovo framework noto come Inferenza Differenziale Latente Stocastica (SLDI) per migliorare la quantificazione dell'incertezza nelle applicazioni di machine learning che coinvolgono dati temporali strutturati. Integrando equazioni differenziali stocastiche (SDE) con modelli generativi profondi, questo approccio offre un nuovo metodo per la modellazione dell'incertezza in tempo continuo.
Il framework incorpora un SDE di Itô all'interno dello spazio latente di un autoencoder variazionale, permettendo una modellazione dell'incertezza flessibile. I componenti chiave dell'SDE—i termini di deriva e diffusione—sono parametrizzati utilizzando reti neurali, consentendo al modello SLDI di generalizzare i modelli classici di serie temporali e di gestire efficacemente campionamenti irregolari.
Contributi Teorici
Un avanzamento significativo è la co-parametrizzazione dello stato adgiunto con una rete neurale specializzata, creando un sistema accoppiato in avanti-indietro che cattura sia l'evoluzione latente che la dinamica del gradiente. Inoltre, l'introduzione di una perdita adgiunta regolarizzata per percorso migliora la stabilità dell'addestramento negli SDE latenti profondi, rendendo SLDI un sviluppo notevole nel machine learning probabilistico stocastico.
Argomenti correlati:
📰 Fonte originale: https://arxiv.org/abs/2601.05227v1
Tutti i diritti e i crediti appartengono all'editore originale.