首页 问答 RTX5060Ti运行Qwen3-VL-8B-Instruct模型速度慢
问题详情

RTX5060Ti16G使用的CUDA12.8+CUDNN9.8+Pytorch 2.11.dev,用的8B,运行一张640×480的简单图片,输出耗时54s

但是同样的图片,在RTX4060 12G使用的CUDA11.8+CUDNN9.6+Pytorch2.9,用的4B输出耗时只有4s。
专门测试了2B、4B、8B的5060Ti,基本都在40s以上。
图片是一张3.png

但是未找到任何文字。

未曝出任何错误。

版权:言论仅代表个人观点,不代表官方立场。转载请注明出处:https://www.stntk.com/question/646.html

发表评论
暂无评论

还没有评论呢,快来抢沙发~

点击联系客服

在线时间:8:00-16:00

客服QQ

70068002

客服电话

400-888-8888

客服邮箱

70068002@qq.com

扫描二维码

关注微信公众号

扫描二维码

手机访问本站