一场名为DeepSeek(深度求索)的回应风暴,正在席卷全球。暴跌
昨天,英伟亿美元创原因中美两国的达市苹果应用商店同时被一条“鲸鱼”攻占。作为一款来自中国的值夜蒸发造历AI应用,DeepSeek完成了对chatGPT的回应超越。
DeepSeek冲上苹果应用商店免费榜第一
在资本市场,这条鲸鱼也正在掀起滔天巨浪。英伟亿美元创原因
龙年最后一个交易日,达市A股AI算力指数大跌3.94%,值夜蒸发造历寒武纪股价跌幅一度超10%。回应
而美股方面,暴跌三大指数收盘涨跌不一,英伟亿美元创原因道指涨0.65%,达市标普500指数跌1.46%,值夜蒸发造历纳指跌3.07%。
美股三大指数收盘涨跌不一
大型科技股涨跌不一,英伟达下跌16.86%,创历史上最大单日个股蒸发规模,市值蒸发5888.62亿美元(约合人民币4.27万亿元);谷歌下跌4.03%;特斯拉下跌2.32%;微软下跌2,14%;亚马逊上涨0.30%;Meta上涨1.91%;苹果上涨3.25%,截至收盘市值为3.5万亿美元,再度成为全球市值最高上市公司。
英伟达下跌16.86%,创历史上最大单日个股蒸发规模
美股半导体芯片板块全线暴跌,博通跌超17%,台积电跌超13%,美国科技跌超11%,Arm Holdings跌超10%,AMD跌超6%,阿斯麦跌超5%。
消息面上,近期火遍全球的DeepSeek推出新模型,该模型以极低的成本实现了与OpenAI o1相当的性能,引发市场对科技AI巨头估值的担忧。简而言之,DeepSeek新模型性能与OpenAI o1旗鼓相当,但成本连后者的零头都不到。有分析人士认为,DeepSeek在有限的硬件资源下实现顶尖的模型性能,减少了对高端GPU的依赖,低廉的训练成本预示着AI大模型对算力投入的需求将大幅下降。正因为此,美股芯片股首当其冲。
不过DeepSeek自己对此却有不同看法,其表示英伟达股价暴跌与它无关。
DeepSeek“回应”英伟达股价暴跌原因
自2023年底chatGPT横空出世,全球科技界的夜空被人工智能点亮以来,从未像现在这般聚集起一股“算力怀疑论”的厚重阴霾。
彻底释放它的,就是一个月来官宣两个开源大模型,被称为“来自东方神秘力量”的DeepSeek。他们的总部位于杭州,是“杭州四小龙”的代表,创始人梁文锋毕业于浙大,前不久刚被国务院总理李强接见。
梁文锋在总理座谈会上发言 新闻联播截图
中国的大模型已经追上美国了?
故事还得追溯到一个月前,1月23日,中国大模型创业团队DeepSeek官宣了新一代开源大模型DeepSeek-V3,部分性能与GPT-4o和Claude Sonnet 3.5等顶尖模型相近。
一个月后,DeepSeek-R1开源模型面世,在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。
DeepSeek-R1开源模型面世,性能比肩OpenAI o1正式版
整件事最为传奇的地方在于,DeepSeek-V3的训练成本不到竞争对手的十分之一。Deepseek-R1的训练成本虽然没有公布,但它的收费却只有OpenAI o1的三十分之一。
简单说,现阶段DeepSeek就是全球大模型“性价比”的代名词。这就不难理解,全球的科技爱好者这两天都在下载体验DeepSeek。在国外,已经出现“使用DeepSeek构建一切”“Goodbye chatGPT”这样的话题。
昨天,同在杭州,《黑神话:悟空》出品人、游戏科学创始人冯骥总结了DeepSeek六大特点:强大、便宜、开源、免费、联网、本土。他还说:DeepSeek,可能是个国运级别的科技成果。
听上去有点夸张,但类似的讨论已经在美国持续了一周时间。在参与媒体访谈时,谷歌前CEO埃里克·施密特改变了美国在AI方面保持了两到三年领先优势的看法。他表示,过去6个月,中国以一种非同寻常的方式迎头赶上,其中一个项目就是DeepSeek。
昨天傍晚DeepSeek最新发布的乙巳新年春节AI贺词
他们不是在复制,是在创新
当然,更多的是来自同行满满的敬意。英伟达高级研究科学家Jim Fan评价R1:“我们生活在这样一个时间线上,一家非美国公司正在维持OpenAI的原始使命——真正开放、前沿的研究,赋予所有人力量。这看似不合逻辑,但最有趣的结果往往最容易发生。”
这个不合逻辑在哪?在美国AI初创公司Perplexity首席执行官Aravind Srinivas看来,DeepSeek的开发显然也受制于高端芯片等硬件,但“需求是发明之母”,DeepSeek用变通的方式构建了高效的解决方案。
他说自己非常惊讶,“通常的认知是中国人擅长复制。如果我们停止发表研究论文,停止描述我们的基础设施架构细节,停止开源,他们将无法赶上……这并不是说他们在复制,而是在创新。”
DeepSeek对话界面
那么,DeepSeek究竟用了什么魔法呢?
比如,他们对通用的模型推理步骤进行了调整。以往模型在提升推理能力时通常依赖于“监督微调”这个环节。这个环节可以简单类比为人类的填鸭式教育,就是让大模型反复做题,学习人类的推理方式。
而DeepSeek-R1在训练过程中直接跳过了这个环节,进入了“强化学习”阶段,探索大模型在没有任何监督数据的情况下,通过纯强化学习进行自我进化。他们要求大模型必须要把思考过程写出来,通过“奖励”引导这个“学生”找到最佳方案。
经历了无数次训练后,大模型这个学生迎来了“Aha moment”(顿悟时刻)。
这个“顿悟”外加其他工程上的优化,DeepSeek证明了疯狂堆积算力、数据的“大力出奇迹”不是通往AGI的唯一路径。
当优雅的算法能够降低对算力的依赖,目前全球的算力是否存在过剩,未来市场对算力的需求是否需要修正?这是近期动摇全球资本市场对科技企业的估值,出现动荡的根本。
最早的AI尝试用在了炒股上
在官方公众号上,DeepSeek对自己的介绍是,投身于探索AGI的本质,不做中庸的事,带着好奇心,用最长期的眼光去回答最大的问题。
在这次一鸣惊人前,很多人在国产的大模型江湖没听说过DeepSeek的名号。一定程度上缘于他们至今没有融过资,更别说接到任何一个巨头的“橄榄枝”。但这并不妨碍他们可能是“国内拥有最多高性能GPU的公司”。
这个底子,是他们做量化投资打下的。在轰炸AI圈之前,DeepSeek及背后的幻方量化是金融江湖成名已久的高手。
低调的创始人梁文锋是80后,出生在广东的一个五线城市,父亲是一名小学老师。他毕业于浙江大学,主修软件工程,人工智能方向。有同事评价梁文锋:完全不像一个老板,而更像一个极客。因为作为老板,他本人每天都在写代码、跑代码,学习能力惊人。
2016年,幻方量化首次上线运行AI策略。2018年,确立了要成为一家AI科技公司。2023年7月,梁文锋在杭州创立深度求索DeepSeek。
在团队配置上,DeepSeek只有139名研发人员,差不多是OpenAI的五分之一。其中,算法、推理框架、多模态等研发工程师以及深度学习方面的研究人员共有约70人。
梁文锋曾透露,DeepSeek并没有什么高深莫测的奇才,都是一些Top高校的应届毕业生,没毕业的博四、博五实习生,还有一些毕业才几年的年轻人,“V2模型没有海外回来的人,都是本土的。前50名顶尖人才可能不在中国,但也许我们能自己打造这样的人”。
无论是在技术还是人才上,梁文锋似乎坚定地看好中国走出自己的模式,从而扮演科技变革引领者的角色。
今年1月20日,也就是DeepSeek-R1发布的当天,他参加了总理座谈会。会上李强总理强调,“要以科技创新推动新旧动能转换,集中力量突破关键核心技术和前沿技术,加快推进科技成果产业化,努力培育更多经济新增长点”。
橙柿互动·都市快报记者 梁英杰
编辑 高欣奕
审核 罗祎 陈欣文
责任编辑:荀建国_NN7379>友情链接: 北京朝阳望京小街获评商业服务领域标准化建设街区辽宁锦州:引“智”推进公平竞争 激发民营经济活力鸿蒙座舱汽车 今年底面世全面升级/华为鸿蒙3.0来了 推全新编程语言山东旅游职业学院校史馆正式开馆 庆祝30周年华诞双城三圈系列港深紧密互动圈/河套合作区 港深科创新天地南部战区位黄岩岛领海领空及周边区域组织开展战备警巡双城三圈系列港深紧密互动圈/河套合作区 港深科创新天地全国所有省份医保“家庭共济”范围扩大至近亲属永作推动人类和平发展进步的中坚力量——写在中华人民共和国恢复联合国合法席位50周年之际包装新标准 实施看市场“百年百大考古发现”令人瞩目加强市场监管 推动传统服务向"优"转型南部战区位黄岩岛领海领空及周边区域组织开展战备警巡中国修改监察法 授予监察机关必要的监察措施福建:实施养老机构食安团标 老年人吃出温暖“幸福味”山东冠县:月饼礼盒包装“轻装上阵”个人所得税专项附加扣除马上截止 还不会填报?快来学南部战区位黄岩岛领海领空及周边区域组织开展战备警巡全面升级/华为鸿蒙3.0来了 推全新编程语言川藏、青藏公路通车70周年 绿色能源点亮高原个人所得税专项附加扣除马上截止 还不会填报?快来学异种器官移植再突破:全球第三例基因编辑猪肾移植人体|周一健北京公布5起旅游市场价格专项执法典型案例天津安泰医院因使用过期医疗器械被罚广东:集体约谈多次抽检不合格食品生产企业中国维和医疗队援非记:蓝盔天使的“金字招牌”国考报名人数破200万创新高 最热职位超20000:1异种器官移植再突破:全球第三例基因编辑猪肾移植人体|周一健双城三圈系列港深紧密互动圈/河套合作区 港深科创新天地追逐梦想的舞台 展示星光的大道——写在全国第十一届残运会暨第八届特奥会开幕之际北京石景山:开展加油机计量专项监督检查江西省市场监管局提示:警惕蟹卡预售“陷阱”“百年百大考古发现”令人瞩目全国所有省份医保“家庭共济”范围扩大至近亲属订合同、立遗嘱等事项办理都涉公证 公证事业潜力巨大加快推进知识产权创新人才集聚 泉州首届专利检索大赛落幕11月中国339个地级及以上城市平均空气质量优良天数比例为93.8%北京公布4起旅游领域违法典型案例订合同、立遗嘱等事项办理都涉公证 公证事业潜力巨大