Это хорошо известный эффект: -segment
видео разбивается на допустимую точку входа видео (т.е. I-кадр), но не всегда на действительную точку входа аудио.
Лучший способ обойти это - разделить видео и аудио на первом шаге:
ffmpeg -i F:\video_data_set\4k_compressed.mp4 -f segment -segment_time 5 -segment_start_number 1 -c:v copy -an -copyts -avoid_negative_ts 1 F:\video_data_set\test\%d_4k_compressed.mp4 -vn -c:a aac -ar 44100 -b:a 128k F:\video_data_set\test\audio.m4a
затем перейдите к фрагментам видео, как в текущем рабочем процессе.
Для последнего шага используйте
ffmpeg -hide_banner -f concat -safe 0 -i F:\video_data_set\test\files_2.txt -i F:\video_data_set\test\audio.m4a -map 0:v -map 1:a -c copy -threads 8 F:\video_data_set\4k_compressed_1.mp4
Чтобы заново добавить аудио.