RTX5060Ti运行Qwen3-VL-8B-Instruct模型速度慢

码农网 2026年01月27日 48 浏览状态问题还没有人回答，等你来解答呢~

首页问答 RTX5060Ti运行Qwen3-VL-8B-Instruct模型速度慢

问题详情

RTX5060Ti16G使用的CUDA12.8+CUDNN9.8+Pytorch 2.11.dev，用的8B，运行一张640×480的简单图片，输出耗时54s

但是同样的图片，在RTX4060 12G使用的CUDA11.8+CUDNN9.6+Pytorch2.9，用的4B输出耗时只有4s。
专门测试了2B、4B、8B的5060Ti，基本都在40s以上。
图片是一张

但是未找到任何文字。

未曝出任何错误。

好问题 0

版权：言论仅代表个人观点，不代表官方立场。转载请注明出处：https://www.stntk.com/question/646.html

发表评论

暂无评论

还没有评论呢，快来抢沙发~

数据统计

735

个问题

380

条回答

我要提问

我要回答

我的提问

搜索问题

知识达人

程序员在线

9 次回答

翼龙云TG_yilongcloud

7 次回答

coder一枚

7 次回答

a游苏杭

6 次回答

dt_7992973394!

6 次回答

热门问题

2026-01-22 555

2026-01-22 521

2026-01-22 515

2026-01-22 490

2026-01-22 474

创造一个强大的网站从未如此简单！