阿里云宣布通义千问 720 亿参数模型开源

智能计算 时间:2023-12-01来源:IT之家

IT之家 12 月 1 日消息,阿里云宣布开源通义千问 720 亿参数模型 Qwen-72B、18 亿参数模型 Qwen-1.8B 及音频大模型 Qwen-Audio,目前已上线阿里魔搭社区。

本次开源的模型中除预训练模型外,还同步推出了对应的对话模型,面向 72B、1.8B 对话模型提供了 4bit / 8bit 量化版模型,便于开发者们推理训练。

IT之家注:阿里云此前已经开源了 70 亿参数模型 Qwen-7B 以及 140 亿参数模型 Qwen-14B。

据介绍,Qwen-72B 搭载了强大的系统指令(System Prompt)能力,用户只用一句提示词就可定制自己的 AI 助手,要求大模型扮演某个角色,或者执行特定的回复任务。

IT之家附模型链接:

通义千问-72B-预训练:

  • https://modelscope.cn/models/qwen/Qwen-72B

通义千问-72B-Chat:

  • https://modelscope.cn/models/qwen/Qwen-72B-Chat

通义千问-72B-Chat-Int8:

  • https://www.modelscope.cn/models/qwen/Qwen-72B-Chat-Int8

通义千问-72B-Chat-Int4:

  • https://www.modelscope.cn/models/qwen/Qwen-72B-Chat-Int4

通义千问-1.8B-预训练:

  • https://modelscope.cn/models/qwen/Qwen-1_8B

通义千问-1.8B-Chat:

  • https://modelscope.cn/models/qwen/Qwen-1_8B-Chat

通义千问-1_8B-Chat-Int8:

  • https://www.modelscope.cn/models/qwen/Qwen-1_8B-Chat-Int8

通义千问-1_8B-Chat-Int4:

  • https://www.modelscope.cn/models/qwen/Qwen-1_8B-Chat-Int4

通义千问-Audio-预训练:

  • https://modelscope.cn/models/qwen/Qwen-Audio

通义千问-Audio-Chat:

  • https://modelscope.cn/models/qwen/Qwen-Audio-Chat

模型下载(以通义千问-72B-Chat-Int4 为例):

from modelscope import snapshot_downloadmodel_dir = snapshot_download("qwen/Qwen-72B-Chat-Int4")


关键词: 阿里云 AI大模型 通义千问

加入微信
获取电子行业最新资讯
搜索微信公众号:EEPW

或用微信扫描左侧二维码

相关文章


用户评论

请文明上网,做现代文明人
验证码:
查看电脑版