top
本文目录
DeepSeek 的成就
DeepSeek官网
一九云企业级香港CN2极品线路
国内访问跟国内服务器没区别
仅需 28.5 元/月起
立即抢购
国内高防云服务器
4H-4G-100硬盘-200G防御(上层封UDP)
仅需 110 元/月起
立即抢购
一九云企业级安全高防服务器
800G超高防御,企业级安全保障
仅需 500 元/月
立即抢购

DeepSeek 震撼全球,背后的原因是什么?

介绍

中国的 AI 企业 DeepSeek 通过发布与美国公司如 OpenAI 和 Anthropic 的最先进产品相媲美的高效 AI 模型,给科技行业带来了巨大冲击。成立于 2023 年的 DeepSeek,仅用少量资金和计算能力就达到了这些成就,相较于竞争对手显得尤为突出。

DeepSeek

DeepSeek 的成就

V3 模型12 月,DeepSeek 发布了 V3 模型,这是一个非常强大的“标准”大型语言模型,功能水平与 OpenAI 的 GPT-4 和 Anthropic 的 Claude 3.5 相当。

尽管这些模型容易出错,有时还会编造事实,但它们可以执行回答问题、撰写文章、生成计算机代码等任务。在解决问题和数学推理测试中,它们的表现甚至超过了人类平均水平。

据报道,V3 的开发成本约为 558 万美元,这比 GPT-4 超过 1 亿美元的开发费用要低得多。

DeepSeek 声称使用了约 2000 个由 NVIDIA 制造的 H800 GPU 进行 V3 的训练,相比之下,其他公司可能使用多达 16000 个更强大的 H100 芯片。

R1 模型1 月 20 日,DeepSeek 发布了另一个模型 R1,这是一种所谓的“推理”模型,旨在逐步处理复杂的问题。这些模型在需要上下文、包含多个相互关联部分的任务(如阅读理解和战略规划)中表现出色。

R1 是 V3 的改进版,经过一种称为强化学习的技术修正。它似乎与去年发布的 OpenAI 的 o1 处于同等水平。

此外,DeepSeek 还利用相同技术创建了一个可以在家用电脑上运行的小型开源模型版本。

DeepSeek官网

www.deepseek.com
THE END
icon
0
icon
打赏
icon
分享
icon
二维码
icon
海报
发表评论
评论列表

赶快来坐沙发