(资料图)
8月25日,据《科创板日报》讯,阿里云今日推出大规模视觉语言模型Qwen-VL,并对其直接开源。Qwen-VL以通义千问70亿参数模型Qwen-7B为基座语言模型研发,支持图文输入。相较于此前的VL模型,Qwen-VL除了具备基本的图文识別、描述、问答及对话能力之外,还新增了视觉定位、图像中文字理解等能力,可用于知识问答、图像标题生成、图像问答、文档问答、细粒度视觉定位等场景。
关键词:
(资料图)
8月25日,据《科创板日报》讯,阿里云今日推出大规模视觉语言模型Qwen-VL,并对其直接开源。Qwen-VL以通义千问70亿参数模型Qwen-7B为基座语言模型研发,支持图文输入。相较于此前的VL模型,Qwen-VL除了具备基本的图文识別、描述、问答及对话能力之外,还新增了视觉定位、图像中文字理解等能力,可用于知识问答、图像标题生成、图像问答、文档问答、细粒度视觉定位等场景。
关键词:
关于我们 - 联系我们 - 版权声明 - 招聘信息 - 友链交换
2014-2023 经济新闻网 版权所有. All Rights Reserved.
备案号:皖ICP备2022009963号-1 未经过本站允许,请勿将本站内容传播或复制.
联系我们: 39 60 29 14 2 @qq.com