Я хотел бы предложить использовать Audcity для зацикливания аудио в течение необходимого времени, а затем объединить два файла. muxing - это архивирование аудио и видео файлов (и субтитров) в медиа-контейнер.
ffmpeg должен иметь возможность демультиплексировать ваше видео (без звука) и снова смешать его с вашим sounfile.