开云体育
中国不能能永恒跟班!
作 者丨张静波
华商韬略出品丨ID:hstl8888
2024 年冬天,杭州。
当西方还千里浸在圣诞节的狂欢中时,一位中国码农,站在强劲的落地窗前,远眺着窗外的京杭大运河。
几分钟后,他作念了一件令硅谷胆怯的事。
"一种新的款式,让通盘山谷皆嗡嗡作响!"
好意思国 CNBC 电视台在报说念这件事对硅谷的影响时,这样评价说念。
12 月 26 日,杭州一家名为"深度求索"的中国初创公司,发布了全新一代大模子:
DeepSeek-V3。
在多个基准测试中,DeepSeek-V3 的性能均高出了其他开源模子,致使与顶尖的闭源大模子 GPT-4o 不相高下。
尤其在数学推理上,DeepSeek-V3 更是遥遥率先。
令东说念主诧异的是,DeepSeek-V3 在性能并排 GPT-4o 的同期,研发却只花了 558 万好意思元,窥伺成本不到后者的二十分之一。
这让好意思国东说念主透澈坐不住了。
在此之前,谷歌和 Open AI 花了几年时辰,耗资数亿致使数十亿好意思元,调用了几万块首先进的 GPU,才干成一样的事情。
利弊的对比,让好意思国东说念主反念念:大模子和算力,是否还值得投资?
好多硅谷大佬在纷繁点赞的同期,也体验到中国科技带来的苦涩:当好意思国东说念主休息时,他们在发奋追上咱们!
有道理的是,这件事与中国空军六代机现身,险些前后脚发生。
不少好意思国东说念主觉得,这比六代机更像上世纪 50 年代,苏联抢先辐照第一颗东说念主造卫星的斯普特尼克时刻。
可是,委果让好意思国硅谷感到震荡的,还不是 DeepSeek-V3 的高性能、低成本,而是中国东说念主展现出的独创精神。
中国 AI 公司畴昔险些皆在照搬硅谷,以致东说念主们开阔觉得:好意思国擅长从 0 到 1 的本事突破,而中国只擅长从 1 到 100 的行使落地。
DeepSeek-V3 缓和了这种成见,它以 MLA、DeepSeekMoE 等多项始创性本事,大幅提高了模子的性能和窥伺效果。
好意思国东说念主诧异地发现,底本中国公司也不错当作翻新孝顺者,在他们的游戏除外,自定游戏规定。这在畴昔是极其苦处的。
因为发达太过优胜,DeepSeek 在硅谷被誉为来自东方的机密力量。
这股机密的东方力量,令东说念主称奇的场合在于,它幕后的资方并不是腾讯、阿里这样的互联网巨头,而是一家低调的私募基金——幻方量化。
现在,国内领有万卡 GPU 的企业不进步 5 家,幻绵薄是其中之一。
它在 2023 年景就子公司"深度求索",运转 DeepSeek 大模子的研发,通盘团队唯独 139 名成员,远少于 OpenAI 的 1200 东说念主。
执掌这支战队的,是一个叫梁文峰的 80 后,亦然幻方量化的创始东说念主。
梁文峰和幻方的故事,始于 2008 年。
那一年,从浙大毕业、主修软件工程的他,莫得像同龄东说念主一样,插足大厂当码农,而是一个东说念主跑到成皆,蜗居在出租屋里。
在那处,梁文峰运转沟通用规划机收获的各式途径。
几番折腾下来,他决定下场作念量化投资。但这个决定并防止易,毕竟那时量化在国内照旧个新事物。
好多东说念主并不笃信,量化不错收获。
每当艰巨时,梁文峰总会想起量化投资之父西蒙斯的一句话:一定有办法对价钱建模。
在这个信念撑执下,梁文峰苦苦熬了两年,终于柳暗花明。2010 年,沪深 300 股指期货推出,量化投资迎来了春天。
乘着这股东风,梁文峰和他的团队大赚一笔,自营资金进步 5 亿元。
也便是并吞时期,跟着深度学习算法的突破,东说念主工智能大爆发。早年在浙大就沟通东说念主工智能的梁文峰,燃起雄雄斗志。
2015 年,他和浙大学友,共同创立了幻方量化。
几个激越粗糙的年青东说念主,试图用数学和东说念主工智能,在中国打造一个像文艺回复那样寰宇顶级的量化对冲基金。
只是一年后,他们就上线了第一笔由 AI 驱动的实盘来回,并在随后,将整个来回政策皆 AI 化。
新本事的加执,让幻方量化旗下基金答复率,远超同期沪深 300 指数。
这推动幻方量化基金规模执续攀升,2021 年一度超千亿元大关,位各国内量化四大天王之一。
可是,基金规模扩张的同期,梁文峰却面对一个难办问题。
AI 来回政策需要算力支执,尤其是,跟着模子参数的激增,对 GPU 算力的需求也在不断增长。
奈何破解这一难题?梁文峰的礼聘是:堆算力!
从 2019 年运转,幻方量化大规模布局 AI 算力。
当年就投资 2 亿元,建成"萤火一号" AI 算力集群,搭载 1100 块 GPU 算卡。而彼时的特斯拉,才刚刚提倡 Dojo 超算意见。
几个月后,当英伟达发布最新 A100 芯移时,梁文峰再次抢跑,成为亚太地区第一批拿到此卡的东说念主。
紧接着 2021 年,他又投资 10 亿元,建成"萤火二号",搭载 1 万 A100 算卡,算力颠倒于 76 万台个东说念主电脑。
其占大地积,比 10 个篮球场还要大。
在 AI 大模子还莫得爆发的年代,梁文峰的举动,让好多东说念主感到轻易。
一家私募基金囤这样多算力,究竟意欲何为?致使有媒体怀恨:幻方量化把 A 股散户吓坏了。
外界对幻方量化的联想,还停留在本钱商场上。
但梁文峰的眼神,早已望向星辰大海。
2017 年,谷歌沟通团队在一篇始创性的论文中,初度提倡 Transformer 架构。这是一种统统基于细心力机制的神经集聚,它颠覆了畴昔的传统算法。
一家叫 OpenAI 的好意思国初创公司,基于新架构不断窥伺我方的大模子。最终在 2022 年以 ChatGPT 引爆 AI 大模子期间。
尔后,人人互联网巨头,沿着 OpenAI 的道路鼓动,很少有东说念主质疑。
但一群初生牛犊的年青东说念主,在梁文峰的携带下,干了一件极其轻易的事:他们试图纠正 Transformer 架构。
事实上,从 2023 年创立深度求索,进犯大模子的第一天起,梁文峰过火团队对算法框架的反念念就运转了。
当别东说念主堕入毛糙师法 OpenAI 的惯性中时,这群年青东说念主不走寻常路。
他们冒着失败的风险,神勇尝试了 MLA(多头潜在细心力机制)、DeepSeekMoE(搀杂行家模子)等多种始创性本事。
几年前囤下的海量算力芯片,为他们的逸想,插上了翅膀。
最终,这群年青东说念主创造了历史:DeepSeek-V3 横空出世,通宵胆怯了硅谷。
对比中好意思科技产业,咱们接续惊羡:
中国为什么出不了像乔布斯、马斯克、黄仁勋一样伟大的企业家?
乔布斯生前唯唯一个目的:辞世,便是为了转变寰宇。
黄仁勋早在后生时,就立下志在千里:要作念不一样的事,要透澈转变规划。
马斯克更是轻易地喊出:要殖民火星,为东说念主类寻找第二家园。
比较之下,中国企业家似乎把更多的眼神,放在了收获和糊口上,很少昂首仰望星空,对翻新的珍摄也不够。
事实上,畴昔 30 年,咱们照旧俗例摩尔定律从天而下,躺在家里 18 个月就会出来更好的硬件和软件。
这使得咱们在一轮又一轮的 IT 波浪中,基本莫得参与到委果的本事翻新里。
但这种步地,在近几年悄然转变,中国腾达代企业家正以突破性翻新,在西方的游戏除外别辟门户。
"中国也要缓缓成为翻新孝顺者,而不是一直搭便车。"梁文峰暗示。
早在上大学时,梁文峰就详情:AI 一定会转变寰宇。毕业后,他在量化投资上,赚了满盈多的钱。
这使得他,有满盈的本钱,听从内心的声息,去作念我方喜欢的事情,而不是起始量度轻重得失。
DeepSeek 创立之初,就成就了中枢职责:探索通用东说念主工智能的骨子!
在中国 AI 界,还很少有企业敢提倡如斯轻易的目的。
于是,畴昔几年,当好多大模子厂商忙着抢用户,作念贸易化变当前,梁文峰却苦哈哈搞起了看似不收获的基础沟通。
"翻新不统统是贸易驱动的,还需要景仰心和创造欲。"他说。
在梁文峰看来,中国企业在畴昔被贸易驱动的惯性料理了。他但愿 DeepSeek 能解脱这种料理。
这样的经营理念,在当下的中国企业界,显得有点离经叛说念。
也曾有不啻一位业内东说念主士暗示:
梁文峰是中国 AI 界相等苦处的东说念主,他领有恐怖的学习才气,兼具强劲的 infra 工程和模子沟通才气,又能诊治资源。
在里面职工看来,梁文峰则统统不像雇主,更像一个极客。
时于本日,他依旧延续着低调的立场,和公司其他沟通员一样,每天看论文,写代码,参与小组沟通。
这个低调的大佬,就连选东说念主、用东说念主的形势也跟主流方枘圆凿。
当好多大模子公司热衷于去外洋挖东说念主时,梁文峰却反治其身,坚执从原土招东说念主,并放出豪言:
"寰宇前 50 名顶尖东说念主才可能不在中国,但也许咱们能我方打造这样的东说念主。"
不仅莫得外洋东说念主才,也莫得行业大佬。梁文峰更喜欢莫得素养的年青东说念主,因为他们不受条条框框的料理。
在 DeepSeek,选东说念主的方法一直皆是可爱和景仰心。
事实上,这家初创公司并非外界传言的,有一批深不能测的奇才,而皆是一些毕业才几年的年青东说念主。
致使,好多是北大、清华等 Top 高校还没毕业的博四、博五实习生。
因为劳动太前沿,这些年青东说念主在开展劳动时,险些莫得参考贵府。但也恰是这种空缺,让他们勇于突破传统。
比如,DeepSeek-V3 最要紧的翻新之一 MLA 架构,就来自一个年青东说念主的突发奇想。
DeepSeek 里面,也莫得高下级单干。
沟通经由中,若是有想法,每个东说念主皆不错拉东说念主沟通,并随时调用公司窥伺集群的卡,无需审批,不设上限。
这种看似松散的措置形势,极大地诊治了整个东说念主的景仰心和创造欲,让 DeepSeek-V3 得以横空出世。
在梁文峰身上,咱们吞吐看到了乔布斯、马斯克、黄仁勋的影子。
"中国 AI 不能能永恒处在跟班的位置!"
"委果的差距不是一年或两年,而是原创与师法之差。"
这两句从梁文峰口中喊出的话,不仅事关 AI 产业,亦然中国企业在跟班、师法了西方几十年后,不得不面对的突破主义。
低落的果子皆被摘完毕,唯独勇于突破,才能找到新的出息。
梁文峰并不孑然。
今天,从大疆无东说念主机汪滔,到宇树机器东说念主王兴兴……一开阔腾达代企业家,正将中国科技产业带向无东说念主区。
[ 1 ] 《揭秘 DeepSeek: 一个更极致的中国本原守望主义故事》暗涌 Waves
[ 2 ] 《轻易的幻方:一家隐形 AI 巨头的大模子之路》暗涌 Waves
THE END
尊敬的读者一又友们,至心感谢您订阅《华商韬略》,为了便于您实时收到咱们的最新推送,敬请星标华商韬略公众号,感谢支执,期待长久伴您同业。
华商韬略出品
主编:毕亚军 责编:周怡
好意思编:宋晓昱
本文仅代表作家个东说念主不雅点,部分图片来自集聚、图虫创意、东方 IC,未能核实版权包摄的,不为贸易用途,如有滋扰,敬请作家与咱们有关
华商韬略旗下公众号,接待讲理
投稿、约稿、商务结合及建议
敬请有关:010-65580525
zy@hsmrt.com 周总监
◆◆◆
本文系网易新闻•网易号【特点成长盘算】
签约账号【华商韬略】原创内容
◆◆◆
"点赞"是喜欢开云体育,"在看共享"是真爱