我需要通过单词自动分割语音视频,因此每个单词都是一个单独的视频文件.你知道怎么做的吗?
我的计划是检测静音部分并将它们用作单词分隔符.但我没有找到任何工具来做到这一点,看起来像ffmpeg不是正确的工具.
media audio video ffmpeg video-processing
audio ×1
ffmpeg ×1
media ×1
video ×1
video-processing ×1