SCRAPL:用于机器学习的随机路径散射变换

Gemini AI生成的图像
研究人员推出了一种新型优化方法SCRAPL(基于随机路径的散射变换用于机器学习),旨在简化小波散射变换在神经网络训练中的应用。SCRAPL采用随机方法,提高了联合时频散射变换在声音模式分析中的效率,尤其适用于颗粒合成和与Roland TR-808的匹配。该方法还引入了一种重要性采样启发式策略,以改善模型的收敛性和性能。相关代码和音频样本已作为Python包发布,便于在音频处理任务中更广泛地应用。
介绍SCRAPL:一种基于散射变换的机器学习新方法
研究人员开发了“基于随机路径的散射变换用于机器学习”(SCRAPL),旨在提高深度学习应用中散射变换的效率。这种方法解决了与小波散射变换系数相关的显著计算开销,而这些系数对于计算机视觉和音频处理中的感知质量评估至关重要。
SCRAPL提供了一种随机优化方案,简化了多变量散射变换的评估,从而减轻了对计算资源的负担。它专门针对联合时频散射变换(JTFS)进行了实现,有效地对多个尺度和速率的频谱时间模式进行了解调。
- 无监督声音匹配:SCRAPL已被应用于区分数字信号处理(DDSP)任务,专注于颗粒合成器与经典Roland TR-808鼓机之间的无监督声音匹配。
团队已将他们的代码和音频样本公开发布。SCRAPL也作为Python包提供,使得该领域的从业者能够轻松使用。
相关主题:
SCRAPL随机路径散射变换机器学习可微数字信号处理重要性采样
📰 原始来源: https://arxiv.org/abs/2602.11145v1
所有权利和署名均属于原出版商。