数据:
DeepSeek-V3 Star数量:7.77万
DeepSeek-R1 Star数量:6.59万
OpenAI最高Star数量项目:Whisper,7.57万
线索:
DeepSeek的成功展示了开源AI不断扩展的潜力和技术创新,吸引了众多企业的关注并带来了大量的开发机会。随着多个云服务平台接入DeepSeek模型,可能加速AI技术的普及和商业化应用。同时,这一事件可能对已有的AI大模型市场带来冲击,尤其是OpenAI面临更强的竞争,投资者需关注市场的变化和技术进展带来的新机会。
正文:
DeepSeek项目在GitHub上的Star数量已超过OpenAI,成为开源AI领域的里程碑。截止到本周五下午,DeepSeek-V3大模型的Star数量达到了77,700,超过了OpenAI的热门项目Whisper。去年12月26日,DeepSeek AI发布了该模型,它迅速成为语言模型的性能标杆。
DeepSeek-V3模型使用了一种动态注意力机制,通过实时调整注意力权重来优化文本生成的质量,同时,它的混合专家架构包含6710亿个参数,但在处理时仅激活370亿个参数,显著降低了计算成本。DeepSeek-V3的训练成本为557.6万美元,而其他竞争模型如Llama 3则高达3930万美元的预算。
在1月23日,DeepSeek基于V3提出了DeepSeek-R1,采用强化学习重构训练方法,显著提升了模型性能。相比于OpenAI的o1,DeepSeek-R1在任务性能上有明显优势,并支持将推理能力迁移至更小的模型,为边缘计算和即时应用开辟更多可能。
DeepSeek的开源策略为开发者提供了大量机会。尽管DeepSeek App官报面临网络攻击问题,但国内如阿里云、华为云等多家平台已接入DeepSeek大模型,国外的英伟达、亚马逊和微软云也同样宣布了相关合作。
随着DeepSeek系列模型的推出,业界对其核心的强化学习方法GRPO的进一步研究已逐渐展开,推动生成式AI的快速发展。
发布时间:
2025-02-07 16:44:35
评论 ( 0 )