AMD发布10亿开源AI模型OLMo,用Instinct MI250 GPU集群训练,助力AI技术发展
更新时间:2024-11-08 10:45:47作者:yidaimei
11 月 8 日消息,AMD 公司于 10 月 31 日发布博文,宣布推出首个完全开放的 10 亿参数语言模型系列 AMD OLMo,为开发者和研究人员提供强大的 AI 研究工具。
AMD OLMo 模型使用从零开始训练的 10 亿参数语言模型系列(LMs),在 AMD Instinct™ MI250 GPU 集群上训练,使用了超过 1.3 万亿个 tokens 进行预训练,让模型在处理自然语言任务时具有强大的推理能力。
援引新闻稿,OLMo 模型采用解码器(decoder-only)架构,并通过下一个标记预测(next-token prediction)进行训练,这种架构在生成文本和理解上下文方面表现出色。
与其他同类开源模型相比,AMD OLMo 在推理能力和聊天能力上表现优异。尤其是在多个基准测试中,其性能与最新的 OLMo 模型相当,且计算预算仅为其一半。
OLMo 除数据中心使用外,更支持配备 NPU(Neural Processing Unit,神经处理单元)的 AMD Ryzen AI PC 能够部署模型,使开发者能在个人设备提供 AI 功能。
AMD OLMo 是完全开源的,这意味着其他开发者和公司可以自由使用和修改这些模型,这让其成为希望探索 AI 技术替代方案的企业的一个可行选择。
AMD发布10亿开源AI模型OLMo,用Instinct MI250 GPU集群训练,助力AI技术发展相关教程
- 微软推出ZeRO技术,助力AI大模型训练时间和成本降低
- 微软联合新加坡国立大学,发布多模态AI助手 AssistGPT,助力人工智能技术发展
- 2024年AI技术应用趋势:NVIDIA专家展望,激发无限惊喜与创新!
- AMD CES 2024:AI计算引领未来,AMD展示AI技术在CES 2024的领先地位
- 微软启动全球AI培训项目,助力人民掌握生成式AI技能,提升全球AI应用水平
- AMD承诺将开源更多GPU软硬件内容,助力开发者创新研发
- 英伟达推出最强AI芯片:首发HBM3e,大模型运行能力提升3.5倍
- 轻量级冠军:NVIDIA 发布具有领先准确率的小语言模型,引领AI技术新风向
- AMD发布锐龙PRO 7000系处理器,首发AI引擎,搭载Zen4和RDNA 3架构
- 微软AI战略势头显现:AI技术加速推动微软在人工智能领域的发展
- AMD CL26低时序内存为什么这么抢手?探秘甜点频率的魅力
- 微软史诗级变革:Windows 11正式推行无密码登录,安全性得到提升
- Windows系统编年史:从XP到Win12,谁是你的心中痛点?
- 首张RDNA 4“巨齿鲨”,华硕推出ATS RX 9070 GRE O12G显卡,性能强劲游戏体验升级
- 英伟达CEO黄仁勋2025财年薪酬达4990万美元,创历史新高
- GMKtec EVO-X2发布!搭载AMD处理器,128GB内存,迷你PC性能再次突破