Ваша маска - это одно изображение, поэтому она не будет отслеживать объект, но я предполагаю, что ваша проблема в том, что наложенные пиксели являются статическими. Вам нужно будет зациклить маску, так как alphamerge заканчивается самым коротким входом, и наложение повторяет последний кадр вторичного входа.
ffmpeg -y -i sample_video.mp4 -loop 1 -i masked_image.png ...