AI导航网

技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

AMD发布首个AI小语言模型：6900亿token、推测解码提速3.88倍

时间：2024-10-02分类：人工智能作者：快科技原文地址

快科技10月1日消息，AMD发布了自己的首个小语言模型(SLM)，名为“AMD-135M”。

相比于越来越庞大的大语言模型(LLM)，它体积小巧，更加灵活，更有针对性，非常适合私密性、专业性很强的企业部署。

AMD-135小模型隶属于Llama家族，有两个版本：

一是基础型“AMD-Llama-135M”，拥有多达6700亿个token，在八块Instinct MIM250 64GB加速器上训练了六天。

二是延伸型“AMD-Llama-135M-code”，额外增加了专门针对编程的200亿个token，同样硬件训练了四天。

创建与部署流程

它使用了一种名为“推测解码”(speculative decoding)的方法，通过较小的草稿模型，在单次前向传播中生成多个候选token，然后发送给更大的、更精确的目标模型，进行验证或纠正。

这种方法可以同时生成多个token，不会影响性能，还可以降低内存占用，但因为数据交易更多，功耗也会增加。

AMD还使用AMD-Llama-135M-code作为CodeLlama-7b的草案模型，测试了推测解码使用与否的性能。

比如在MI250加速器上，性能可提升最多约2.8倍，锐龙AI cpu上可提升最多约3.88倍，锐龙AI NPU上可提升最多约2.98倍。

推测解码

AMD-135M小模型的训练代码、数据集等资源都已经开源，遵循Apache 2.0。

按照AMD的说法，它的性能与其他开源小模型基本相当或略有领先，比如Hellaswag、SciQ、ARC-Easy等任务超过Llama-68M、LLama-160M，Hellaswag、WinoGrande、SciQ、MMLU、ARC-Easy等任务则基本类似GTP2-124MN、OPT-125M。

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 [email protected] 举报，一经查实，本站将立刻删除。

相关推荐

外媒：库克和苹果亟需在中国找到AI合作伙伴

10月25日消息，苹果公司首席执行官蒂姆·库克（Tim Cook）本周对中国进行了访问，这已是他今年第二次到访中国。

作者：网易科技时间：2024-10-25

小鹏AI天玑5.4.0全球首发，智驾云端大模型竞争拉开序幕

10月24日消息，今日，在小鹏P7+AI智驾技术分享会上，小鹏汽车副总裁、自动驾驶负责人李力耘博士、小鹏汽车智能体验负责人于桐，分别介绍了小鹏端到端大模型的技术优势，和首发搭载在小鹏P7+上的AI天玑5.4.0版本。与此

作者：TechWeb.com.cn 时间：2024-10-24

现代起亚与首尔大学等设立机器人研发实验室专注于可移动的双臂机器人

10月24日消息，据外媒报道，现代汽车集团旗下的现代和起亚这两家公司在当地时间周三宣布，他们已同首尔大学、浦项科技大学和韩国科学技术研究院，联合设立了机器人研发实验室。

作者：TechWeb.com.cn 时间：2024-10-24

苹果阐述分阶段发布Apple Intelligence原因：隐私优先，逐步实现智能化服务升级

苹果公司的软件主管Craig Federighi近日在接受媒体采访时，详细阐述了对Apple Intelligence功能的发布策略。他解释了为何这一功能将分阶段推出，以及苹果在这一过程中所秉持的理念和策略。

作者：TechWeb.com.cn 时间：2024-10-24

AI手机看荣耀：荣耀MagicOS 9.0正式发布，开启手机自动驾驶新时代

10月23日，荣耀在MagicOS 9.0发布会及开发者大会上正式发布行业首个搭载智能体的个人化全场景AI操作系统——MagicOS 9.0，推出全新自研魔法大模型家族，并宣布YOYO助理正式升级为YOYO智能体。发布会上，荣耀全新智能

作者：TechWeb.com.cn 时间：2024-10-24

让AI像人类一样操作电脑！Anthropic上新Claude 3.5 Sonnet模型新能力

10月23日消息，OpenAI竞争对手Anthropic宣布推出升级版的Claude 3.5 Sonnet和新款Claude 3.5 Haiku。

作者：TechWeb.com.cn 时间：2024-10-23

OceanBase 4.3.3发布 CEO杨冰：一体化数据库是AI时代的数据底座

10月23日消息，随着AI技术发展，越来越多的AI应用不再局限于纯文本来生成回答，涉及的数据类型日益复杂，并且常存储于IT架构的不同数据库中，这对数据库提出了新的要求，包括提升性能与响应速度，要求数据库处理和存

作者：TechWeb.com.cn 时间：2024-10-23

ColorOS 15体验：系统丝般润滑 AI随叫随到

十月，这个充满科技气息的月份，无疑成为了各大手机厂商激烈角逐的战场。10月9日，联发科(MediaTek)顺应AI时代的潮流，推出了全新的5G旗舰AI芯片——天玑9400。这款芯片的亮点之一就是其NPU（神经网络处理单元）的算

作者：TechWeb.com.cn 时间：2024-10-23

Claude 3.5深夜觉醒，编程干翻o1，Agent一夜变天

编辑：编辑部 HYZ 太科幻了，深夜上线的Claude，可以像人类一样使用计算机了？查看屏幕、移动光标、点击按钮、输入文本，还能查找代码错误、自动搜集信息填表。AI推理已至瓶颈，下一个爆破点，就是AI操作电脑！

作者：新智元时间：2024-10-24

AIGC时代如何打击图片造假诈骗？合合信息文档篡改检测有妙招

近日，第七届中国模式识别与计算机视觉大会（简称“PRCV 2024”）在乌鲁木齐举办。大会由中国自动化学会（CAA）、中国图象图形学学会（CSIG）、中国人工智能学会（CAAI）和中国计算机学会（CCF）联合主办，新疆大学承

作者：编程之家时间：2024-10-22