• 发文
  • 评论
  • 微博
  • 空间
  • 微信

陈根:英特尔Aurora genAI模型以万亿参数入局大模型领域

根新未来 2023-06-05 11:22 发布于陕西 发文

文/陈根

自从ChatGPT诞生以来,越来越多的科技公司入局生成式AI的开发,大模型领域变得“越来越卷”。紧随微软、谷歌、Meta之后,英特尔亦于日前,在德国汉堡举行的国际超级计算大会高性能会议上,官宣“与阿贡国家实验室携手,用Aurora超级计算机开发生成式AI模型Aurora genAI,参数量将多达1万亿”。

英特尔Aurora genAI模型将以NVIDIA的Megatron和微软的DeepSpeed两个框架为基础。这些结构增强了强度和容量。其中,Megatron用于分布式训练大规模语言模型的架构,专门针对Transformer进行了优化,不仅支持传统分布式训练的数据并行,也支持模型并行。DeepSpeed则专注于优化大型深度学习模型的训练,通过提高规模、速度、成本和可用性,释放了训练 1000 亿参数模型的能力,极大促进大型模型的训练。

英特尔Aurora genAI模型的规模达1万亿个参数,相较于ChatGPT的1750亿参数,其在参数规模上增长了约570%。而支持这大规模参数所需的算力则是由英特尔与阿贡国家实验室和HPT合作开发的百万兆级超计算机Aurora提供。Aurora 超级计算机由英特尔Xeon CPUMax和Xeon GPU Max系列芯片提供支持,采用了21248个Sapphire Rapids至强CPU、63744 个Xe架构的Ponte Vecchio GPU。Aurora超级计算机还使用了1024个DAOS节点和10.9PB的DDR5傲腾持久内存,所有这些组件通过oneAPI互相链接,实现了百万兆级性能。Aurora 超级计算机的浮点运算能力达到了2exaFLOPS,而目前TOP500排名第一的超级计算机Frontier其浮点运算能力也才1exaFLOPS。

作为一个纯粹以科学为中心的生成式AI模型,Aurora genAI将被应用于各类科学领域,包括从分子和材料设计到涵盖数百万来源的综合知识素材;可用于各种科学应用,如系统生物学、高分子化学、能源材料、气候科学和宇宙学研究等,并为此提供值得探索的实验设计思路。这些模型还将用于加速癌症及其他疾病的相关生物过程的识别速度,并为药物设计提供靶点建议。除了科研之外,Aurora genAI 还具有在自然语言处理、机器翻译、图像识别、语音识别、金融建模等商业领域的应用潜力。

作为ChatGPT的有力竞争对手,Aurora genAI的公布预示着AI大模型赛道上的重磅玩家在不断的升级,这将极有可能在未来对各种科学领域产生重大影响。

声明:本文为OFweek维科号作者发布,不代表OFweek维科号立场。如有侵权或其他问题,请及时联系我们举报。
2
评论

评论

    相关阅读

    暂无数据

    根新未来

    预见未来科技与商业,洞察前沿趋势...

    举报文章问题

    ×
    • 营销广告
    • 重复、旧闻
    • 格式问题
    • 低俗
    • 标题夸张
    • 与事实不符
    • 疑似抄袭
    • 我有话要说
    确定 取消

    举报评论问题

    ×
    • 淫秽色情
    • 营销广告
    • 恶意攻击谩骂
    • 我要吐槽
    确定 取消

    用户登录×

    请输入用户名/手机/邮箱

    请输入密码