阿里巴巴发布通义千问7B模型 开源免费可商用 支持8K上下文长度 – 蓝点网

今天阿里巴巴宣布旗下大型语言模型产品通义千问 7B 参数模型已经开源,阿里该模型为完全开源、巴巴免费、发布费可商用。通义这个模型包括两个子模型,千问斯里兰卡whatsapp客服号一个是型开下文斯里兰卡ws不死号通用型的 Qwen-7B 模型,另一个是源免对话模型 Qweb-7B-Chat,两个模型均为开源免费可商用。商用K上
这两个模型目前已经在阿里达摩院的支持魔搭社区和国外知名 AI 模型社区 Hugging Face 上线,有兴趣的长度用户可以下载模型进行测试。
魔搭社区:https://modelscope.cn/models/qwen/Qwen-7B/summary
Hugging Face:https://huggingface.co/Qwen/Qwen-7B
Github:https://github.com/QwenLM/Qwen-7B
以下是蓝点阿里云对 Qwen-7B 模型的自述:
通义千问 – 7B(Qwen-7B) 是阿里云研发的通义千问大模型系列的 70 亿参数规模的模型。Qwen-7B 是阿里基于 Transformer 的大语言模型,在超大规模的巴巴斯里兰卡whatsapp不死号预训练数据上进行训练得到。预训练数据类型多样,发布费覆盖广泛,通义包括大量网络文本、专业书籍、叙利亚ws超级号代码等。同时,在 Qwen-7B 的基础上,我们使用对齐机制打造了基于大语言模型的叙利亚ws蓝标号 AI 助手 Qwen-7B-Chat。Qwen-7B 系列模型的特点包括:
大规模高质量预训练数据:我们使用了超过 2.2 万亿 token 的自建大规模预训练数据集进行语言模型的预训练。数据集包括文本和代码等多种数据类型,覆盖通用领域和专业领域。
优秀的模型性能:相比同规模的开源模型,Qwen-7B 在多个评测数据集上具有显著优势,甚至超出 12-13B 等更大规模的模型。评测评估的能力范围包括自然语言理解与生成、数学运算解题、代码生成等。
更好地支持多语言:基于更大词表的分词器在分词上更高效,同时它对其他语言表现更加友好。用户可以在 Qwen-7B 的基础上更方便地训练特定语言的 7B 语言模型。
8K 的上下文长度:Qwen-7B 及 Qwen-7B-Chat 均能支持 8K 的上下文长度,允许用户输入更长的 prompt。
支持插件调用:Qwen-7B-Chat 针对插件调用相关的对齐数据做了特定优化,当前模型能有效调用插件以及升级为 Agent。
相关文章
- 最近上古卷轴3晨风放出了游戏新mod的消息,这款游戏虽然已经发售了15年,但是游戏不断的更新也预示着游戏有着不出的生命力,最近画质mod放出,想必很多玩家也很感兴趣,一起来了解一下吧。《上古卷轴3:晨2025-05-07
- 《魔域口袋版》重磅消息:定了!全新神阶副本真的要来了2022-03-08编辑:angle307 凭借四阶神器的强大吸引力,已然成为玩家挑战“未来与往昔之森”的最大2025-05-07
- 原神雷电将军技能加点推荐发布时间:2022-03-09 11:07:53来源:逗游作者:逗游网原神手游男生女生一起玩原神4.4原神游戏类别:角色扮演游戏大小:236.77M 游戏语言:简体中文游戏版本2025-05-07
- 《魔域口袋版》周年庆典活动3月17日正式开启2022-03-13编辑:jackey 玩家除了可以在端内享受到海量的周年庆福利之外,全民欧皇的壕礼抽奖环节更让大家期2025-05-07
- 最近微软新IP游戏圣歌公布了货币系统的相关消息,这款游戏全新IP也将在财年最后一个月上线,官方表示游戏上线初期不会加入实时服务,货币系统会在游戏上线一段时间后推出,有兴趣的小伙伴可以了解一下。自EA推2025-05-07
- 梦幻模拟战谜之骑士毕业装备推荐发布时间:2022-03-07 17:51:58来源:逗游作者:逗游网梦幻模拟战角色经典军事战棋游戏类别:战争策略游戏大小:1.98G 游戏语言:简体中文游戏版本:v1.2025-05-07
最新评论