使用 FFmpeg 将视频或音频文件中的语音提取为 WAV 格式
使用 FFmpeg 将视频或音频文件中的语音提取为 WAV 格式非常简单。以下是具体命令和说明:
基本命令
ffmpeg -i input.mp4 -vn -acodec pcm_s16le -ar 44100 -ac 2 output.wav
参数解释:
-i input.mp4
:输入文件(可以是视频或音频文件,如 .mp4
, .mkv
, .mp3
等)。
-vn
:禁用视频流(仅提取音频)。
-acodec pcm_s16le
:指定音频编码为 PCM 16-bit 小端格式(WAV 标准格式)。
-ar 44100
:设置采样率为 44100 Hz(常用标准)。
-ac 2
:设置声道为双声道(立体声)。
output.wav
:输出的 WAV 文件。
其他常见需求
1. 保留原始音频参数
如果希望直接复制原始音频流(不重新编码,速度更快):
ffmpeg -i input.mp4 -vn -c:a copy output.wav
(注意:仅当原始音频是 WAV 兼容的编码格式时可用,如 PCM。)
2. 单声道输出
强制转换为单声道(适用于语音场景):
ffmpeg -i input.mp4 -vn -acodec pcm_s16le -ar 16000 -ac 1 output.wav
-ar 16000
:16kHz 采样率(语音常用)。
-ac 1
:单声道。
3. 截取片段
提取音频的某一段(例如从 00:01:30 到 00:02:30):
ffmpeg -i input.mp4 -vn -ss 00:01:30 -to 00:02:30 -acodec pcm_s16le output.wav
查看音频信息
在提取前,可以先查看文件的音频流信息:
ffmpeg -i input.mp4
在输出中找到音频流的格式(如 Audio: aac
)、采样率、声道数等。
注意事项
- 文件格式:WAV 是无损格式,文件较大。如果需要压缩,可改用其他格式(如
.mp3
, .flac
)。
- 多音轨处理:如果视频中有多个音频流,需通过
-map
参数指定具体流(例如 -map 0:a:0
选择第一个音频流)。
通过上述命令,你可以快速提取高质量的 WAV 语音文件!