“ 导读:17岁考入浙大,23岁探索量化交易,31岁创办两家头部量化私募,33岁斩获金牛奖,38岁宣布进军通用人工智能、创办深度求索(Deepseek),40岁出席总理座谈会。他就是幻方量化和DeepSeek的创始人梁文锋。”
最近全球爆火的DeepSeek,实现了7天增长1亿用户的奇迹,成为全球增长1亿用户花费时间最短的超级产品。瞬间刷新了ChatGPT 2个月达成1亿用户的纪录,DeepSeek绝对可以申报吉尼斯世界纪录了。
今天我们就来聊聊DeepSeek背后的男人梁文锋,到底有多牛?01数学天才,浙大求学
梁文锋,1985年出生,湛江市吴川市覃巴镇米历岭村人,他成长于一个很普通的家庭,父母为人很淳朴,都是小学语文老师。
初高中时期就展现出极强的数学天赋
梁文锋从小成绩优异,小学就读于吴川梅菉小学,小学六年级时通过考试被吴川一中录用,在吴川一中完成了初中、高中学业,一直是学校里的“尖子生”,并在数学学科表现出极大天赋。
最后一排右边第6个是梁文锋
“他初中就学完高中的数学,甚至已经开始学大学的数学,数学思维能力很强。”其初中班主任容老师表示,“初中时期的梁文锋性格很文静,但不是书呆子,他在学习上很有自己的‘一套方法’,很注重劳逸结合,仿佛不需要花很多时间来学习就可以学好每一个学科。”
2002年,17岁的梁文锋以吴川一中第一的成绩考上浙江大学本科电子信息工程专业,于2006年考上浙江大学信息与通信工程专业研究生。
第一的荣誉,并非一蹴而就。
据曾在梅菉小学任教并担任过梁文锋班主任的李老师讲述,梁文锋在小学时期便展现出了极高的课堂专注力。他总是能够全神贯注地倾听讲授,并积极地参与课堂讨论,回答问题。此外,梁文锋对挑战难题抱有浓厚兴趣,善于总结学习方法,具有刻苦钻研的精神,能迅速归纳老师的授课内容,形成自己的知识体系。
浙大求学历程
2002年9月至2006年6月,梁文锋来到浙江杭州,在浙江大学电子信息工程专业读本科。2007年,22岁的梁文锋又考上浙江大学信息与通信工程专业研究生。师从项志宇,主要做机器视觉研究。
梁文锋的求学历程
2008年,在浙大读研期间,23岁的梁文锋与同学一起组团队开始积累市场行情数据、金融市场其他相关数据以及宏观经济等数据。这一年梁文锋也带领团队开始使用机器学习等技术探索全自动量化交易。而此时,正值全球金融危机。2010年6月,25岁的梁文锋从浙江大学信息与通信工程专业硕士毕业,他的硕士毕业论文题目是《基于低成本PTZ摄像机的目标跟踪算法研究》。从2008年开始,梁文锋就一直在探索全自动量化交易。命运的齿轮开始转动,为梁文锋未来成为全球关注焦点做好了铺垫。0236岁管理千亿私募
2013年,28岁的梁文锋与同样来自浙江大学的同学徐进一起创办了杭州雅克比投资管理有限公司。
2015年4月,中证500股指期货上市,这也标志着中国量化私募进入2.0时代。量化基金拥有了更强大的量化工具,对冲手段的丰富让资本市场的价格发现功能更完备,市场由纯多头变得更加立体化。
2015年6月,30岁的梁文锋与徐进一起加入阳光私募大军,在浙江杭州创办了杭州幻方科技有限公司(公司英文名High-Flyer),也就是现在的浙江九章资产管理有限公司。梁文锋及其团队开始依靠数学与人工智能进行量化投资,立志成为世界顶级的量化对冲基金。
所谓量化投资,通俗地说就是用计算机取代人,通过数量化方式,程序化发出买卖指令,投资收益较为稳定。
2016年,幻方量化在这一年加入了中基协(中国证券投资基金业协会),意味着他们在行业内的专业性和规范性得到了官方认可。
2016年10月21日,幻方量化推出第一个AI模型,第一份由深度学习生成的交易仓位上线执行,使用GPU进行计算,这也是梁文锋和GPU的缘起。在此之前,梁文锋团队的算法主要依靠线性模型和传统机器学习算法,模型计算主要依赖于CPU。2016年底31岁梁文锋,管理的资金规模已经大约10亿元。
到2017年底,几乎所有的量化策略都采用AI模型计算。他们管理的资金规模也扩大到30亿元。
2018年,梁文锋确立公司以AI为主要发展方向,幻方量化也首次获得了私募金牛奖——这是中国私募证券领域的最高奖项。
2019年,34岁的梁文锋带领的幻方量化管理规模突破百亿。也是这一年,为了解决算力瓶颈,梁文锋投资2亿元自主研发深度学习训练平台“萤火一号”,为此搭载了1100块GPU显卡,2020年正式投入使用。
一位幻方量化的员工曾在公司博客中写道,“老板本人每天都在写代码、跑代码。”这是就是梁文锋与其他公司的不同之处。
2021年,梁文锋36岁,幻方量化的资金管理规模突破千亿大关,正式跻身千亿量化私募之列。幻方量化、九坤投资、明汯投资、灵均投资,因管理资金规模均超过600亿元,被业界称为量化私募领域的“四大天王”。2021年2月,《征服市场的人:西蒙斯传》出版,梁文锋曾为此文作序,他在书中写道:“每当在工作中遇到困难的时候,我会想起西蒙斯的话‘一定有办法对价格建模’。”注:詹姆斯·西蒙斯是量化投资领域的泰斗,创办了文艺复兴科技公司和大奖章基金。
就像英特尔公司前CEO安迪·格鲁夫《只有偏执狂才能生存》一书中提到,“领导者需要具备“偏执”的特质,以便在变化中寻求机遇并果断行动。”专注、独特,梁文锋就是具备这样特质的典型代表。特别能体现梁文锋其特质的是,这一年幻方斥资10亿元建设“萤火二号”。而且是先于一些云厂商拿到英伟达A100显卡,并且其AI集群搭载显卡的数量达到“万卡级别”。有报道称,当时国内超过1万枚GPU的企业不超过5家,而且除了幻方之外,其他4家公司都是互联网大厂。
2023年7月,38岁的梁文锋创办了杭州深度求索人工智能基础技术研究有限公司,也就是DeepSeek。也是我们今天看到的,国运级创新,梦开始的地方!
03
旧世界分崩离析,新时代光速到来
在AI大模型尚未爆发的时间节点,幻方量化如此大规模的算力投入,让许多人感到难以理解,甚至引来了一些质疑和批评。有人认为,一家私募基金花费如此巨额的资金囤积算力,是一种不切实际的疯狂行为,这些算力资源在短期内似乎无法带来直接的经济效益。
但梁文锋的目光早已超越了眼前的利益,他深知,算力是未来科技竞争的核心要素,尤其是在人工智能领域,强大的算力将为算法的训练和优化提供坚实的保障。他坚信,在不远的将来,这些看似疯狂的投入将为公司带来不可估量的回报。
事实证明,梁文锋的决策是极具远见卓识的。这些大规模的算力布局,为幻方量化后续在AI领域的深入探索和创新发展奠定了坚实的基础,也为DeepSeek-V3和DeepSeek-R1大模型的成功研发提供了不可或缺的算力支持。
2024年5月,39岁的梁文锋带领DeepSeek发布了混合专家语言模型DeepSeek-V2。DeepSeek-V2的API定价为每百万tokens输入1元、输出2元,价格仅为GPT-4 Turbo的百分之一。DeepSeek-V2模型发布后,字节跳动、阿里巴巴、百度、腾讯等大厂纷纷宣布大模型产品降价。因此,DeepSeek也被称为“AI界的拼多多”。
2024年12月26日,梁文锋又带领深度求索(DeepSeek)公司发布了DeepSeek-V3,并且还公开了由梁文锋、罗福莉(就是雷军要千万年薪挖角的那个95后才女)等人撰写的53页论文《DeepSeek-V3 Technical Report》。DeepSeek公司官网显示,DeepSeek-V3的多项数据“吊打了”国内外一众大模型产品,更关键的是它还便宜。被称为“来自东方的神秘力量”。
DeepSeek-V3的各项测试结果与同行对比更难能可贵的是,梁文锋组建的还是一支纯粹的本土研发团队,只有中国程序员,没有海归人才。不少人都是应届毕业生和毕业一两年的年轻人。比如DeepSeek的朱琪豪是2024届北大计算机学院软件研究所博士毕业生;代达劢是2024年北京大学计算机学院计算语言所的博士毕业生;郭达雅是2023年中山大学博士毕业生……甚至有报道称DeepSeek团队员工的工作年限约为3到5年,而那些拥有8年以上研发经验的人还可能会被直接拒绝。
因为他们害怕这样的人包袱太重、缺乏创新的动力。你甚至想不到,DeepSeek团队只有139名研发人员,而开发ChatGPT的OpenAI团队则有1200名研究人员。“只招1%的天才,去做99%中国公司做不到的事情。”面试过DeepSeek的应届生这样评价其招聘风格。梁文锋曾对36氪暗涌说:“如果追求短期目标,找现成有经验的人是对的。但如果看长远,经验就没那么重要,基础能力、创造性、热爱等更重要。”
DeepSeek也得到了国家的高度重视。2025年1月20日,梁文锋参加了中共中央政治局常委、国务院总理李强主持召开专家、企业家和教科文卫体等领域代表座谈会,并在会上发言。同天,2025年1月20日晚,DeepSeek就上演了一场“偷袭珍珠港”——发布推理模型 DeepSeek-R1 正式版,同步开源模型权重,并允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。这款大模型在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。
这一次,DeepSeek真正引发了硅谷的恐慌,引爆全球。受DeepSeek冲击,美国芯片巨头英伟达股价暴跌17%,博通下跌17%,AMD下跌6%,微软下跌2%。
因为DeepSeek-R1模型的训练成本仅为560万美元,而OpenAI训练ChatGPT-4o所花费的成本高达7800万美元甚至是1亿美元,双方的成本至少是10倍的差距,“AI界的拼多多”实至名归。
2025年1月22日,微软CEO萨蒂亚・纳德拉在瑞士达沃斯世界经济论坛上表示:“看到DeepSeek的新模型,真的令人印象非常深刻。他们切实有效地开发出了一款开源模型,在推理计算方面表现出色,且超级计算效率极高。”
“我们必须非常、非常认真地对待中国的这些进展,”纳德拉说。
2月6日,据媒体报道,微软、英伟达、亚马逊、英特尔、AMD等科技巨头都纷纷宣布上线DeepSeek大模型。美国科技行业的“霸主地位”遭遇史无前例的挑战。美国总统特朗普称DeepSeek的出现“给美国相关产业敲响了警钟”,并强调美国需要集中精力赢得竞争。最后,用梁文峰的采访作为总结:“以后硬核创新会越来越多。当这个社会让硬核创新的人功成名就,群体性想法就会改变。我们只是还需要一堆事实和一个过程。”
过去四十年,房地产和互联网的造富运动都并非由底层创新驱动,而只有当人们看到回报和付出有一定的关系,投机才不会成为中国商业社会最大的价值观。梁文锋和DeepSeek带来的并不仅是模型本身的技术创新,而更大价值在于让中国人看到了“我能行”,对科技行业给予的信心无比重要,政府、投资人、学者、企业家、从业者等各个参与者都能在百年未有之大变局中看到科技创新的希望之火。梁文锋重点事件整理
文中图片和素材均来源于网络