OpenAI首席技术官Mira Murati近日透露,公司正在开发的新一代人工智能模型GPT-5,有望在2025年底或2026年初推出,该模型在特定任务中达到博士级智能水平。
字节跳动被曝正在与博通合作开发AI处理器,以确保获得高端芯片的供应。知情人士透露,这款AI处理器将采用5nm工艺制造,设计进展顺利,不过尚未开始流片。
过去一个周末,国内外AI行业还有哪些热点值得关注呢?让乌鸦君带你一起看看吧。
/ 01 / 大模型
1)高通宣布开源 AI 模型,助力构建人工智能应用
据Toms hardware报道,高通宣布,已为其45 TOPS Hexagon NPU开发、优化并验证了人工智能模型。这些模型已在高通的AI Hub上提供给注册软件开发人员,可以使用已经训练好的模型来构建他们的人工智能应用。
2)GPT-5或拥有“博士级智能”,最早明年底推出
据外媒报道,OpenAI首席技术官Mira Murati近日透露,公司正在开发的新一代人工智能模型GPT-5,有望在2025年底或2026年初推出,该模型在特定任务中达到博士级智能水平。
另外,Murati谈道,ChatGPT等AI 系统在特定任务中已经达到了人类的水平,不过也在很多任务中没有达到。她将GPT-3的智力阶段比作是蹒跚学步的孩子阶段,而GPT-4是聪明的高中生阶段。她透露,OpenAI将着眼于特定任务的博士级智能。
3)Meta的AI技术将可能整合到 "Apple Intelligence "中
据华尔街日报报道,苹果据称正与老对手Meta谈判,将 Meta 的生成式人工智能模型整合到最近发布的人工智能系统Apple Intelligence中,用于iPhone和其他设备,旨在将苹果智能打造成类似应用商店的平台。
除了谷歌和Meta,人工智能初创公司Anthropic和Perplexity也一直在与苹果商谈,希望把它们的生成式人工智能引入苹果智能系统。
4)编码数学击败GPT4-Turbo,DeepSeek-Coder-v2登顶竞技场最强开源编码模型
开源编码模型DeepSeek-Coder-v2在Coding Arena中攀升至第4名,水平接近GPT-4-Turbo。在编码领域的整体性能评估中,DeepSeek-Coder-v2的评分和稳定性均位于前10,超越智谱GLM-4、Llama-3等一众知名开源模型。
据悉,深度求索于上周发布了DeepSeek-Coder-v2,它在编码和数学方面击败了GPT4-Turbo。
/ 02 / AI应用
1)小艺升级为智能体,HarmonyOS NEXT鸿蒙原生智能
在华为开发者大会(HDC 2024)上,华为宣布基于原生智能的AI底座,搭载盘古大模型的小艺能力升级为系统级智能体。升级为智能体后的小艺,支持23类 TOP场景的记忆感知,支持多达23类常用记忆类型,小艺智能体还具备更强的推理规划能力,任务成功率高达90%;在知识问答方面,小艺智能体掌握万亿级tokens的知识量。
2)阿里云推出首个AI程序员
在阿里云上海AI峰会上,阿里云推出了首个“AI程序员”,其具备架构师、开发工程师、测试工程师等岗位技能,能完成任务分解、代码编写、测试、问题修复、代码提交整个过程,号称最快“分钟级”完成应用开发。
据介绍,阿里“AI程序员”是基于阿里通义大模型构建的多智能体,包含任务分解、编码、测试等不同板块,与智能编码助手“通义灵码”有所不同。
3)Kimi出海?月之暗面:目前没有开发和发布海外产品计划
澎湃新闻报道,月之暗面就正在为进军美国市场做准备的传闻进行回应称,目前没有开发和发布任何海外产品的计划。
此前,据外媒The information援引知情人士消息称,月之暗面的员工一直在开发最近在美国推出的产品,包括在苹果和谷歌移动应用商店上架的人工智能角色扮演聊天应用Ohai,以及音乐视频生成器Noisee的网站。
4)百川智能CEO王小川:除了杀时间、省时间,“加时间”是AI应用好赛道
王小川强调大模型创业者在开发AI应用时应非常谨慎,避免简单复制App工厂模式,这可能导致创业者付出巨大代价;他认为医疗是通往AGI(人工通用智能)的难而正确的路径,因为医疗服务的需求无限,智力密度高,能够帮延长生命时间,这是一个平行于省时间、杀时间的一个独立的赛道——加时间。
5)Magnific AI推出Relight功能,随心改变图像的光线和背景
西班牙公司Magnific AI推出新功能“Relight”,在X上引起热议。Relight使用户能够使用人工智能改变图像的光线和背景,使得在以主题为中心的场景中创建真实且多样化的效果。
6)Canalys:中国消费者对AI手机兴趣强烈
据Canalys报告,中国大陆是全球前三大智能手机市场中AI兴趣倾向最强的市场。在全球前三大智能手机市场中国、印度、美国中,具有“高”到“极高”AI兴趣倾向的消费者占比最高,分别达到31%和12%,仅1%消费者对AI毫无兴趣。
/ 03 / 投融资情报
1)OpenAI 以换股方式收购云原生数据库公司Rockset,后者估值最高5亿美金
OpenAI宣布收购企业搜索和分析初创公司Rockset,以帮助 OpenAI 的客户更好地利用私人数据。OpenAI没有透露交易金额。Rockset由前Meta工程师创立,为游戏、金融科技等行业的企业客户提供检索、索引和搜索数据的技术。
据PrivCo数据得知,截至去年8月29日,Rockset公司共获得的融资总额在1亿美金左右,投后估值1亿-5亿美元。也就是说,OpenAI收购Rockset的交易价值最高可达5亿美金。
2)拟募资20.08亿港元,商汤日日新大模型5.5将于7月5日公布
商汤科技发布公告,拟配售B类股份,总筹20.08亿港元(当前约18.71亿元人民币)。据《科创板日报》报道,商汤本次配售有多家战略投资人及头部海外基金入股,现有股东增持,募集资金将用于大模型研究及产品开发等。
报道称,商汤将于7月5日发布日日新5.5大模型。而此前有媒体称,商汤日日新大模型“近期”将迎来重大升级。在长文本处理能力上,升级后的商汤大模型将最新支持100万字以上超长文本,同时最多一次支持50多个文件问题解析。
3)Stability AI 或已任命 Prem Akkaraju 为新任 CEO
Stability AI新任CEO Prem Akkaraju将入职,代替此前由Stability COO和CTO临时担任的联席CEO。根据The Information的报道,Akkaraju曾任视觉特效公司Weta Digital的CEO,他还是Stability AI 的投资者之一。报道称,这些投资者总共出资超过1亿美元,新的资金可能会缩减一些现有投资者的股份。
据悉,创始人兼CEO Emad Mostaque于3个月前离职,Mostaque离开的原因包括投资者对公司财务可行性及其业务运营的担忧。
4)孙正义提前清空英伟达股份,少赚1500亿美元
软银集团创始人孙正义日前回顾投资经历,称其错过英伟达股票大幅增值的机会,错失1500亿美元潜在收益。孙正义还预测,超越人类智能一万倍的超级AI将在十年内广泛运用,协助人类解决疾病、战争等挑战。
孙正义表示,ASI是AGI的升级版,智能水平是人类的100倍甚至 10000 倍,软银的使命是实现 ASI,并相信这将推动人类社会的巨大进步。
/ 04 / AI基础设施
1)字节正与博通开发5纳米AI芯片
字节跳动正在与美国芯片制造商博通合作开发先进的AI处理器,以帮助字节在确保获得足够的高端芯片供应。二者一直是业务合作伙伴,博通曾表示,字节跳动购买了其Tomahawk 5nm芯片以及其用于AI计算机集群的Bailly交换机。
知情人士透露称,这款AI处理器将采用5nm工艺制造,将符合美国的出口限制,由台积电负责生产,尽管设计工作进展顺利,标志着设计阶段结束和制造开始的“流片”尚未开始。
2)小米大模型提效新框架:训练最高提速34%,推理最高提速52%
小米大模型团队提出SUBLLM,开源语音识别工具Kaldi之父Daniel Povey也参与指导。
与Llama等模型相比,SUBLLM在训练和推理速度以及降低内存方面都有了显著提升。在大模型训练中,SUBLLM的速度提高了26%,每个GPU的内存减少了10GB。在推理中,它的速度提高了37%,每个GPU的内存减少了1GB。训练和推理速度分别最高可以提高至34%和52%。
3)字节豆包全新图像Tokenizer:生成图像最低只需32个token,最高提速410倍
字节跳动豆包大模型团队和慕尼黑工业大学提出了全新的1D图像Tokenizer:TiTok,这一Tokenizer打破了2D Tokenizer的设计局限,可以将整个图片压缩至更为紧凑的Token序列。
对于256 x 256分辨率的图片,TiTok最少仅需32个Token就可以表达,比通常2D Tokenizer的256或1024个Token显著减少。在512分辨率TiTok可以获得2.74的FID,不仅超过了DiT(3.04),并且相比DiT在图像生成上加速了410倍。
4)何恺明新作再战AI生成:入职MIT后首次带队,奥赛双料金牌得主邓明扬参与
何恺明入职MIT副教授后,首次带队的论文提出借鉴扩散模型,大改自回归生成。具体来说,让自回归模型抛弃矢量量化,使用连续值生成图像。并借鉴扩散模型的思想,提出Diffusion Loss。研究参与者还有IMO、IOI双料奥赛金牌得主邓明扬。
5)英特尔即将推出的AI PC处理器或将被推迟发货
据业内人士透露,英特尔即将推出的AI PC处理器(代号Lunar Lake)或将被推迟发货,发货时间从原计划的6月推迟到9月。