WhisperX 小笔记 2025-05-10 4 默认分类 自己用的小笔记. 如果在用一些国内的云算力的话得先调用这个来下载WhisperX的模型 ```bash export HF_ENDPOINT=https://hf-mirror.com ``` 指令 ```bash whisperx file.mp3 --model large-v3 --batch_size 16 --language en --chunk_size 20 ``` # 一些参数 - --model large-v3 使用large-v3模型, 显存小需要换更小的模型. - --batch_size 16 batch_size越大, 需要的显存也越大, 但推理的会更快. - --language en,zh 提前设置音频里所使用的语言, 这样就不需要花时间去自动识别. - --chunk_size 20 设置每句话的长度, 默认为 30. 英文字幕先用20看看, 避免单字幕过长导致难以阅读. - –diarize 依据不同的声纹区分说话者. - –compute_type float32 新版本WhisperX可能需要这个. 本文链接: https://blog.yarukon.me/index.php/archives/9/