Visualizing Audio Spectrogram

DualSpec: Text-to-spatial-audio Generation via Dual-Spectrogram Guided Diffusion Model

Abstract: Text-to-audio (TTA), which generates audio signals from textual descriptions, has received huge attention in recent years. However, recent works focused on text to monaural audio only. As we ...

IEEE

Robust Audio-Visual Segmentation via Audio-Guided Visual Convergent Alignment

Abstract: Accurately localizing audible objects based on audio-visual cues is the core objective of audio-visual segmentation. Most previous methods emphasize spatial or temporal multi-modal modeling, ...

Tech Xplore

AI model predicts human attention in 360-degree videos using both sound and vision

Virtual reality (VR) experiences and 360-degree videos are transforming viewers from passive observers into active ...

Some results have been hidden because they may be inaccessible to you

Show inaccessible results

DualSpec: Text-to-spatial-audio Generation via Dual-Spectrogram Guided Diffusion Model

Robust Audio-Visual Segmentation via Audio-Guided Visual Convergent Alignment

AI model predicts human attention in 360-degree videos using both sound and vision

Trending now