ReadCai财经资讯
当前位置:首页 » 13. 科技 » 人工智能

AMD推出开源3B参数语言模型Instella,促进AI社区创新

2025-03-07

数据:

AMD发布完全开源的3B语言模型\”Instella\”。该模型在AMD Instinct MI300X GPU上训练,拥有30亿参数,性能与同类产品(如Llama 3.2 3B、Gemma-2 2B和Qwen 2.5 3B)竞争力强。Instella模型完全开源,包含权重、训练超参数、数据集和代码,旨在促进AI领域的创新与合作。

线索:

AMD推出的开源语言模型可能带来诸多投资机会,包括在人工智能领域的技术合作、开源硬件及软件解决方案的市场需求增加。同时,深度学习模型的开源也可能促使开发人员和研究人员积极参与,进一步优化模型表现。然而,投资者需关注开源领域可能存在的知识产权风险,与其他竞争模型的相对竞争优势也是未来市场变化的重要因素。

正文:

近日,AMD宣布发布开源的Instella,这是其全新的完全开放式3B参数语言模型。AMD表示,Instella代表着“完全开放的最先进的30亿参数语言模型(LM)”。该模型是在AMD Instinct MI300X GPU上进行训练的,性能与Llama 3.2 3B、Gemma-2 2B和Qwen 2.5 3B等同类产品相比,具备很强竞争力。

AMD的Instella模型是从头开始在Instinct MI300X硬件上训练的,并且它是完全开源的。AMD强调,Instella模型的开源内容包括权重、训练超参数、数据集和代码,旨在促进人工智能社区的创新和合作。AMD邀请开发人员、研究人员和人工智能爱好者共同探索Instella,推动语言模型的发展。

有关Instella语言模型的更多信息,可以访问AMD的相关网站,该模型也托管于GitHub平台上。

发布时间:

2025-03-06 13:18:00

相关推荐

评论 ( 0 )

2.5 W

文章

22.1 W

点赞

回顶部