找回密码
 立即注册
  • QQ空间
  • 回复
  • 收藏

为什么自己部署的qwen模型代码补全反应很慢

想自己开发一个类似于通义灵码的VScode插件试试,在ollama中部署了qwen-latest模型,代码补全功能反应很慢
简单的def_add(a,b):补全也要一小会,通义里面的模型补全飞快。这是为啥
为什么自己部署的qwen模型代码补全反应很慢-1.png 请问有大佬开发过类似的插件嘛,我是用Python做的后端服务访问的ollama地址。还有聊天功能在cherrystudio接入反应比我自己写的要快很多 这是为啥

为什么自己部署的qwen模型代码补全反应很慢-2.jpg
回复

使用道具 举报

说点什么

您需要登录后才可以回帖 登录 | 立即注册
HOT • 推荐