-
Notifications
You must be signed in to change notification settings - Fork 71
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
使用 WhisperX 时间戳对齐功能时爆显存 #158
Comments
感觉似乎并不是同一个问题? 我这儿感觉好像还没开始工作就爆显存报错了,所有的项目都这样,不是某个特定的视频内容的问题。。。 |
应该不是字幕文本内容的问题,我换了一个一共就10行的字幕文件一样报错,跟这里描述的比较接近 |
所有内容都出现错误的话,能提供一个音频文件给我进行测试吗? |
转写完成后VAD参数有进行过调整吗?如果转写结果不是直接用于对齐,而是手动导入的,且在此过程中修改了VAD参数,可能会导致爆显存,而且多大的显存也不好使,4090+128G内存实测。建议重新进行一次转写,然后再尝试对齐。 |
也可以试试把软件调成英文,似乎成功概率大点,纯玄学 |
跟这些玄学关系不大 。。。目前看起来可能跟音频时间的关系比较大 测试样板是一段2小时左右的音频,在我的16G卡上,如果如果其他占用显存的任务,直接对齐,大概一半一半的概率能成功,如果有其他任务占用少量显存,大概率失败,如果有其他任务占用较大量显存,一定失败。。。 超过2小时的音频文件几乎不可能对齐成功,而如果把这段音频文件切割成多个文件,那就可以比较稳定的对齐成功 任务失败时,都可以观察到显存使用持续上升直到撑爆 相对来说16G已经是一个比较大的显存数值了,而且说实话2小时的时长也不算特别长,不知道调用 WhisperX 的方式或者软件这端是否还有优化的空间? @CheshireCC |
我认为是和参数有关系,如果参数调的不合适就会出现爆显存,你可以吧参数调整调整试试看,我有一个音频(3个多小时)也是一直对齐失败,一直爆显存,我把参数调整了一下又好了,供参考。 VAD 转写 或者你可以试试这个,这是我调出来的比较好的参数 |
whisperX 可能需要进行一些代码优化,是有可能减少不必要的显存占用的 |
如题,任务开始前显存占用大约1.5G,操作开始时显存占用10G左右,然后很快爆显存。。。
难道16G显存不够吗 。。。
显卡是16G的4070 Ti Super,日志如下:
fasterwhispergui.log
The text was updated successfully, but these errors were encountered: