AMD推出开源3B参数语言模型Instella，促进AI社区创新

2025-03-07

数据：

AMD发布完全开源的3B语言模型\”Instella\”。该模型在AMD Instinct MI300X GPU上训练，拥有30亿参数，性能与同类产品（如Llama 3.2 3B、Gemma-2 2B和Qwen 2.5 3B）竞争力强。Instella模型完全开源，包含权重、训练超参数、数据集和代码，旨在促进AI领域的创新与合作。

线索：

AMD推出的开源语言模型可能带来诸多投资机会，包括在人工智能领域的技术合作、开源硬件及软件解决方案的市场需求增加。同时，深度学习模型的开源也可能促使开发人员和研究人员积极参与，进一步优化模型表现。然而，投资者需关注开源领域可能存在的知识产权风险，与其他竞争模型的相对竞争优势也是未来市场变化的重要因素。

正文：

近日，AMD宣布发布开源的Instella，这是其全新的完全开放式3B参数语言模型。AMD表示，Instella代表着“完全开放的最先进的30亿参数语言模型（LM）”。该模型是在AMD Instinct MI300X GPU上进行训练的，性能与Llama 3.2 3B、Gemma-2 2B和Qwen 2.5 3B等同类产品相比，具备很强竞争力。

AMD的Instella模型是从头开始在Instinct MI300X硬件上训练的，并且它是完全开源的。AMD强调，Instella模型的开源内容包括权重、训练超参数、数据集和代码，旨在促进人工智能社区的创新和合作。AMD邀请开发人员、研究人员和人工智能爱好者共同探索Instella，推动语言模型的发展。

有关Instella语言模型的更多信息，可以访问AMD的相关网站，该模型也托管于GitHub平台上。

发布时间：

2025-03-06 13:18:00

AMD推出开源3B参数语言模型Instella，促进AI社区创新

相关推荐

评论 ( 0 )

取消回复

AMD推出开源3B参数语言模型Instella，促进AI社区创新

相关推荐

评论 ( 0 )

取消回复

ReadCai财经资讯站