使用 FFmpeg 将视频或音频文件中的语音提取为 WAV 格式
使用 FFmpeg 将视频或音频文件中的语音提取为 WAV 格式非常简单。以下是具体命令和说明:
基本命令
ffmpeg -i input.mp4 -vn -acodec pcm_s16le -ar 44100 -ac 2 output.wav
参数解释:
- -i input.mp4:输入文件(可以是视频或音频文件,如- .mp4,- .mkv,- .mp3等)。
- -vn:禁用视频流(仅提取音频)。
- -acodec pcm_s16le:指定音频编码为 PCM 16-bit 小端格式(WAV 标准格式)。
- -ar 44100:设置采样率为 44100 Hz(常用标准)。
- -ac 2:设置声道为双声道(立体声)。
- output.wav:输出的 WAV 文件。
其他常见需求
1. 保留原始音频参数
如果希望直接复制原始音频流(不重新编码,速度更快):
ffmpeg -i input.mp4 -vn -c:a copy output.wav
(注意:仅当原始音频是 WAV 兼容的编码格式时可用,如 PCM。)
2. 单声道输出
强制转换为单声道(适用于语音场景):
ffmpeg -i input.mp4 -vn -acodec pcm_s16le -ar 16000 -ac 1 output.wav
- -ar 16000:16kHz 采样率(语音常用)。
- -ac 1:单声道。
3. 截取片段
提取音频的某一段(例如从 00:01:30 到 00:02:30):
ffmpeg -i input.mp4 -vn -ss 00:01:30 -to 00:02:30 -acodec pcm_s16le output.wav
查看音频信息
在提取前,可以先查看文件的音频流信息:
ffmpeg -i input.mp4
在输出中找到音频流的格式(如 Audio: aac)、采样率、声道数等。
注意事项
- 文件格式:WAV 是无损格式,文件较大。如果需要压缩,可改用其他格式(如 .mp3,.flac)。
- 多音轨处理:如果视频中有多个音频流,需通过 -map参数指定具体流(例如-map 0:a:0选择第一个音频流)。
通过上述命令,你可以快速提取高质量的 WAV 语音文件!