“ 闭源模型们紧张起来了 ”
文|云舒
编辑 | 小白
出品|极新
Meta 于北京时间4月19日凌晨正式发布 Llama 3,官方号称「有史以来最强大的开源大模型」。 本次发布了 8B 和 70B 参数的大模型,提供了新功能,改进了推理能力,在行业基准测试上展示了最先进的性能。8B 参数评测结果碾压 Gemma-7B、Mistral-7B 版本;而 Llama 3 70B 版本评测结果同样也在诸多成绩上超过了 Gemini 1.5 Pro 和 Claude 3 Sonnet。
恰好在4月18日,Stability AI正式发布了Stable Diffusion 3 API,在SD3的技术报告公布几个月之后,用户终于可以上手试用了。
此前4月16日,Create 2024百度AI开发者大会上,李彦宏指出:开源模型会越来越落后。便有了神图诞生。
这也引发了一波讨论,其实 Llama 3 发布前猎户星空创始人傅盛就曾指出:开源社区终将战胜闭源,开源社群具有旺盛的生命力。并给出了三点原因:一、开源社区的产品性能正在直逼闭源,开源和闭源之间的差距已缩短至6-10个月,GPT-4刚发布时该差距为几年;二、大厂虽然更有钱,但是开源社区精英多;三、很多大厂也在加入开源社区。
截止目前,开源的大模型有:
国外开源模型
(图源郭小喵玩AI)
国内开源模型
(图源郭小喵玩AI)
越来越多的模型走向开源,那么 ,开源能否战胜闭源?
其实分开来看,大模型开源后对不同群体会带来不同的影响和优势。从开源大模型企业自身来看,开源可以吸引社区的力量共同参与模型的改进和优化,从而分担研发成本。更关键的是可以获得更多的用户反馈和使用数据,社区贡献者可能会提出新的创新点,这一点可以表现为工程师在开源模型上进行应用开发,再将应用、数据以及模型微调意见反馈给开源社区,进而加固大模型生态,有助于进一步优化模型。站在研发AIGC应用的企业的角度,无疑是为产品落地加快了步伐,更是降低了研发成本。当然更大的意义是,大模型开源后,企业数智化转型成本更低,转型速度进一步加快,社会智能化程度更高。
当然,大模型开源也存在一些挑战,比如潜在的滥用风险、数据隐私问题等,需要通过合理的管理和规范来解决。总的来说,大模型开源是一个多赢的局面,可以促进AI技术的发展和普及。
也有人提出质疑,开源大模型如何商业化?没有盈利终究不是好产品。短期来看,开源大模型塑造的生态首先会为公司带来其他的收益,以阿里的通义千问为例,更多的AIGC企业在开源社区调用通义千问,那么将可能会有更多的企业用阿里云。
此前,「极新」对话行行AI创始人李明顺时,他也坚定表达支持大模型开源的观点,开源大模型的繁荣让更多的普通人能够加入到AI革命中,推动社会的发展。
本文原创:极新(jixintech)