数据:
AMD发布完全开源的3B语言模型\”Instella\”。该模型在AMD Instinct MI300X GPU上训练,拥有30亿参数,性能与同类产品(如Llama 3.2 3B、Gemma-2 2B和Qwen 2.5 3B)竞争力强。Instella模型完全开源,包含权重、训练超参数、数据集和代码,旨在促进AI领域的创新与合作。
线索:
AMD推出的开源语言模型可能带来诸多投资机会,包括在人工智能领域的技术合作、开源硬件及软件解决方案的市场需求增加。同时,深度学习模型的开源也可能促使开发人员和研究人员积极参与,进一步优化模型表现。然而,投资者需关注开源领域可能存在的知识产权风险,与其他竞争模型的相对竞争优势也是未来市场变化的重要因素。
正文:
近日,AMD宣布发布开源的Instella,这是其全新的完全开放式3B参数语言模型。AMD表示,Instella代表着“完全开放的最先进的30亿参数语言模型(LM)”。该模型是在AMD Instinct MI300X GPU上进行训练的,性能与Llama 3.2 3B、Gemma-2 2B和Qwen 2.5 3B等同类产品相比,具备很强竞争力。
AMD的Instella模型是从头开始在Instinct MI300X硬件上训练的,并且它是完全开源的。AMD强调,Instella模型的开源内容包括权重、训练超参数、数据集和代码,旨在促进人工智能社区的创新和合作。AMD邀请开发人员、研究人员和人工智能爱好者共同探索Instella,推动语言模型的发展。
有关Instella语言模型的更多信息,可以访问AMD的相关网站,该模型也托管于GitHub平台上。
发布时间:
2025-03-06 13:18:00
评论 ( 0 )