当前位置：首页 » 13. 科技 » 人工智能

DeepSeek-R1用户测试积极，超算系统助力4bit量化模型

2025-01-23

人工智能

数据：

– DeepSeek-R1是一个高性能的AI模型，接受全球测试。

– 用户需配置496GB显存（7台M4 Pro Mac mini和1台M4 Max Macbook Pro）才能运行4bit量化版，投资超10万元。

– R1在各种榜单上表现突出的同时，其数据蒸馏版Qwen 1.5B小模型也能在浏览器上跑，速度为每秒60个tokens。

– 在LiveBench的测试中，R1在私有数据解决了15.8%的问题，并在公开数据上解决了20.5%。

– 同时，R1的测试结果展示了与o1-preview相近的能力，但具有成本优势。

– 研发者发现R1在计划能力测试中也显示出色，并有潜在的新创业机会可开发。

线索：

DeepSeek-R1的亮眼表现与高成本的硬件需求形成表面对比。虽然高投入能够带来不错的回报，但相对的成本效率及设备配置限制，可能会导致部分用户望而却步。这经常会给投资者带来机会，同时也隐含风险，尤其是在快速发展的AI市场，举步维艰的新兴公司和平台可能会对已有的投资造成威胁。此外，通过搭建能够进行高效微调的第三方平台或许能够开辟新的市场。

正文：

DeepSeek-R1这款AI模型在全球范围内受到了广泛的测试和评估。为了能够使用这个高性能的模型，用户需要投入10万元以上，购买7台M4 Pro Mac mini和1台M4 Max Macbook Pro，并总计配置496G显存去运行4bit量化版本，这样的配置可以说是“家用AGI”级别的豪华配置。另一方面，小型模型R1的数据蒸馏版本Qwen 1.5B仅需在简单的浏览器上运行，并能以每秒60个tokens的速度输出结果。

在排行榜上，DeepSeek-R1的表现非常出色。在LiveBench的测试中，R1在私有数据上解决了15.8%的问题，相比于DeepSeek-V3有了显著提升；而在公开数据上，这一比例更是达到了20.5%，相比DeepSeek-V3上涨了约46%。总体而言，尽管DeepSeek-R1表现与o1-preview的结果相近，但它的使用成本只有o1系列约1/30，这在实际应用中使其优势更加明显。

在计划能力的测试中，DeepSeek-R1再次展现了强大的能力，与o1-preview的表现不相上下。除此之外，R1的数据蒸馏技术在某些任务中也与DeepSeek-V3、GPT-4o和Gemini Flash处于同一水平。

最后，研发者们开始关注到R1在短期内的创业机会，尤其是在构建一个能够进行OpenAI风格强化微调的平台方面，市场潜力巨大。R1提供的强大能力与适当的数据和微调方法结合，有望在特定任务上实现显著的性能提升。

发布时间：

2025-01-22 18:25:20

DeepSeek-R1用户测试积极，超算系统助力4bit量化模型

相关推荐

评论 ( 0 )

取消回复

DeepSeek-R1用户测试积极，超算系统助力4bit量化模型

相关推荐

评论 ( 0 )

取消回复

ReadCai财经资讯站