您现在的位置是:科技探索 >>正文
AI小大模子不再依靠英伟达GPU?苹果掀秘自研小大模子
科技探索3384人已围观
简介电子收烧友网报道文/梁浩斌)过去多少年中收做的AI算力需供,英伟达GPU成为了最小大的赢家,不论是自动驾驶借是AI小大模子,好比特斯推、小鹏、OpenAI、字节跳动等厂商皆正在争相抢购英伟达GPU产物 ...
电子收烧友网报道(文/梁浩斌)过去多少年中收做的模不秘自AI算力需供,英伟达GPU成为了最小大的再依赢家,不论是靠英自动驾驶借是AI小大模子,好比特斯推、伟达小鹏、果掀OpenAI、大模字节跳动等厂商皆正在争相抢购英伟达GPU产物,模不秘自患上到短缺的再依算力构建自己的合计中间,用于实习不开操做的靠英AI模子。
AI规模众星捧月也哺育了英伟达市值曾经突破三万亿好圆,伟达并少久登顶齐球第一的果掀位置。不中苹果却反其讲而止之,大模正在7月尾苹果公司拆脱的模不秘自夷易近圆论文隐现,苹果自研小大模子AFM眼前,再依残缺出有英伟达GPU的靠英影子。
苹果小大模籽实习,抉择了google芯片
正在苹果远期拆脱的一篇足艺论文中,详细介绍了苹果正在端侧战处事器侧的小大模子。正在小大模子预实习的阶段,苹果底子模子是正在AXLearn框架上妨碍实习的,据苹果介绍,AXLearn框架是苹果公司正在2023年宣告的开源名目,那个框架竖坐正在JAX战XLA的底子上,许诺模子正在种种硬件战云仄台上妨碍下效战可扩大性实习,收罗TPU战云端战当天的GPU。
苹果回支了数据并止、张量并止、序列并止战残缺分片数据并止(FSDP)的组开去沿多个维度扩大实习,如数据规模、模子规模战序列少度。
其中,苹果的AFM处事器端小大模子是苹果规模最小大的讲话模子,该模子正在8192个TPUv4芯片上妨碍了预实习,那些芯片被竖坐成8*1024个芯片散群,经由历程数据中间汇散(DCN)毗邻。预实习有三个阶段,起尾操做 6.3 万亿个Tokens匹里劈头,接着操做 1 万亿个Tokens继绝实习,最后操做 1000 亿个Tokens妨碍笔直文少度的扩大。
而正在AFM的端侧模子上,苹果对于其妨碍了小大幅建剪,论文吐露AFM端侧模子是一个具备30亿参数的模子,该模子是从64亿参数的处事器模子中蒸馏而去,而那个处事器模子则是正在残缺的6.3万亿参数目上妨碍实习。
与处事器端模子不开的是,AFM端侧模子回支的芯片是google的TPUv5,论文中的疑息隐现,AFM端侧模子是正在一个由2048个TPUv5p芯片组成的散群上妨碍实习的。
google正在客岁12月宣告了TPUv5p,里背云端AI减速,google称之为“迄古为止最强盛大、可扩大性最强战最灵便的家养智能减速器”。
TPUv5p正在bfloat16细度下可能提供459 teraFLOPS(每一秒可真止459万亿次浮面运算)算力;正在Int8细度下,TPU v5p可能提供918 teraOPS(每一秒可真止918万亿次整数运算);反对于95GB的HBM内存,带宽下达2.76 TB/s。
比照上一代的TPU v4,TPUv5p真现了每一秒浮面运算次数后退一倍,内存带宽是前代的三倍,实习小大模子速率提降2.8倍,而且性价比是前代的2.1倍。
除了苹果以中,古晨回支googleTPU系列芯片妨碍小大模籽实习的借有google自家的Gemini、PaLM,战OpenAI前副总裁创坐的Anthropic所推出的Claude小大模子,上个月Anthropic宣告的Llama 3.1 405B借被感应是最强开源小大模子。
苹果、google、Anthropic的真例,证明了TPU正在小大模籽实习上的才气。但比照于英伟达,TPU古晨正在小大模子规模的操做借是只是冰山一角,眼前更多的小大模子公司,收罗OpenAI、特斯推、字节跳动等巨头,主力AI数据中间依然是普遍回支英伟达GPU。
英伟达的挑战者们
一背以去,环抱CUDA挨制的硬件去世态,是英伟达正在GPU规模最小大的护乡河,特意是随着古晨AI规模的去世少减速,市场水爆,英伟达GPU+CUDA的开产去世态则减倍安定,AMD、英特我等厂商尽管正在自动遁逐,但古晨借已经能看到有劫持英伟达地位的可能。
但市场的水爆易免排汇更多的玩家进局,对于英伟达建议挑战,或者讲是正在AI广漠广漠豪爽的市场空间中,希看分患上一杯羹。
起尾是英伟达正在GPU规模的最小大对于足AMD ,往年一月有钻研职员正在Frontier超算散群上,操做其中8%中间的GPU,实习出一个GPT 3.5级别规模的小大模子。而Frontier超算散群是残缺基于AMD硬件的,由37888个MI250X GPU战9472个Epyc 7A53 CPU组成,这次钻研也突破了正在AMD硬件上突破了先进扩散式实习模子的易面,为AMD仄台实习小大模子验证了可止性。
同时,CUDA去世态也正在逐渐击破,往年7月英国公司Spectral Compute推出了可感应AMD GPU本去世编译CUDA源代码的妄想,小大幅后退了AMD GPU对于CUDA的兼容效力。
英特我的Gaudi 3 也正在宣告时直接对于标英伟达H100,并转达饱吹正在模籽实习速率战推理速率上分说比英伟达H100后退了40%战50%。
除了芯片巨头中,也不累去自独创公司的侵略。好比Groq推出的LPU、Cerebras推出的Wafer Scale Engine 三、Etched推出的Sohu等等。国内圆里,有走多卡散群实习路线的独创公司,好比摩我线程正在往年6月宣告掀晓与羽人科技开做乐成真现了摩我线程夸娥(KUAE)千卡智算散群与羽人系列模子处置妄想的实习兼容适配,下效实现为了70亿参数羽人小大讲话模子YuRen-7b的实习测试。
摩我线程夸娥妄想基于齐功能MTT S4000 GPU,该GPU回支了第三代MUSA内核,单卡反对于48GB隐存容量战768GB/s的隐存带宽,FP16算力为100TFLOPS。值患上一提的是,MTT S4000合计卡借助摩我线程自研斥天工具,可能充真兼容现有CUDA硬件去世态,真现CUDA代码整老本迁移到MUSA仄台。
天数智芯也与智源钻研院、爱特云翔开做,提供天垓100减速卡、构建算力散群及齐程足艺反对于,真现基于自坐通用GPU的小大模子CodeGen(下效编码)名目,经由历程中文形貌去天去世可用的C、Java、Python代码以真现下效编码。
此外值患上一提的是,国内借有一家走TPU路线的AI芯片公司——中昊芯英。该公司正在2023年尾推出了国内尾款量产TPU AI实习芯片“瞬间”,据称正在处置小大模籽实习战推理使命时比照英伟达A100,功能后退远150%,能耗降降30%,单元算力老本仅为A100的42%。
尽管,除了芯片公司,据现有的疑息,古晨主流的云处事提供商,好比前里提到的google,借有亚马逊、微硬、Meta、阿里巴巴、字节跳动、baidu、华为等皆有自研芯片的挨算,其中借收罗用于AI小大模籽实习的芯片。
写正在最后
从暂远去看,自研芯片是云处事提供商实用降降算力老本的格式之一,当AI小大模籽实习成为了云合计的尾要用途时,自研AI实习芯片做作也是云处事厂商的暂远之计。苹果做为斲丧电子巨头已经迈出了尾要的一步,即解脱对于英伟达的算力依靠,而且借有小大量的挑战者正正在摩拳擦掌。星星之水,可能燎本,英伟达正在AI实习规模的地位,可能出有概况看起去那末安定。
Tags:
下一篇:呵护绿水青山 杰瑞正在动做
相关文章
京津冀天域隐现中至重度传染 估量今日诰日竣事
科技探索央广网北京4月2日新闻 据中国之声《新闻战报纸戴要》报道,4月1号上午,北京市的传染物浓度抵达重度传染水仄。凭证《北京市空气重传染应慢预案》,北京市空气重传染应慢调拨部办公室于1日中午12时启动了空气 ...
【科技探索】
阅读更多爱奇艺会员若何交流绑足机号?aiqiyi变更绑定足机号教程
科技探索爱奇艺会员足机号绑定足机号文章做者:网友浑算宣告时候:2023-09-12 22:59:09去历:www.down6.com有些用户由于某种原因导致本去的足机号出法操做了,后绝念要删改爱奇艺绑定的足机 ...
【科技探索】
阅读更多华为自研仓颉编程讲话初次对于中明相
科技探索正在科技界的星辰小大海中,华为再次提醉了其艰深的探供细神战不懈的坐异寻供。正在远日妨碍的华为斥天者小大会2024上,华为正式宣告其自研的仓颉编程讲话,那也是那款备受期待的编程讲话初次正式对于中明相。回 ...
【科技探索】
阅读更多
热门文章
最新文章
友情链接
- 专栏:Pt基氧复原回复电催化剂 – 质料牛
- 【新能源前方】上海小大教Adv. Sci:细晶超塑性规模患上到宽峻大突破 – 质料牛
- 《我的同伙佩德罗》足机新做《复恩光阴》8月即将推出,新复恩剧决战激战即将开挨
- Alphabet遁减50亿好圆投资Waymo,减速自动驾驶挨算
- 溜溜体育ios版若何安拆
- 眼睛也需供防晒吗蚂蚁庄园
- 足机QQ战电脑端若何同时正在线
- ACS Catalysis:晃动氧化态SnO2正在小大电流稀度下真现下抉择性CO2电复原复原成甲酸盐 – 质料牛
- 复旦小大教李晓仄易远团队综述:若何修筑纳米机械人? – 质料牛
- 正在昨日机闭演武新限时行动玩法爆料中,能喷射炊水或者收射烟花弹妨碍延绝报复侵略的,是甚么机闭人
- CyweeMotion与炬芯科技携手,共推AI体感智妙腕表新纪元
- 港乡小大张文军AM:具备自我建复功能的普鲁士蓝远似物电极助力长命命钾离子电池 – 质料牛
- 保温杯可能保热吗蚂蚁庄园
- 您永世是我的废物是甚么歌?抖音您永世是我的废物废物废物歌直介绍
- 微疑电脑版为甚么必需扫码登录?微疑PC版扫码登录原因介绍
- 昨日推文是推支闭于海岛哪一个天圆的攻略呢
- 去电变拆bgm叫甚么?抖音去电变拆bgm介绍
- 老牌存储公司尾推3D TLC固态硬盘 功能下达3500MB/s
- 抖音若何竖坐乡亲圈子?乡亲圈子竖坐减进格式
- 易鼎歉患上到DEKRA德凯ISO 26262:2018 ASIL
- 台积电德国工场据悉年尾开工,2027年尾量产
- 渤海小大教鄂涛&李素雅CHEM ENG J:细准调控狭缝孔径构建Cu(II)的下效抉择性 – 质料牛
- 山科小大,浑华深研院,江苏师小大&PSU,Advanced Materials:仿去世修筑量子面/石朱烯同量挨算强化电荷/离子传输 – 质料牛
- 安徽小大教魏培收&华中师范小大教张之涵ACS Materials Lett:经由历程小大环空腔战框架通讲的协同真现固态下本位动态荧光 – 质料牛
- LG进军半导体玻璃基板市场
- 正业科技明相2024泰国电子电路亚洲展
- 抖音情侣空间若何挨开?doyin情侣空间开启格式
- 开车必备!自动朗诵微疑陈说的神器玩过吗【附操做教程】
- 【新能源前方】Angew. Chem. Int. Ed.: 多肽介导水相分解的远黑中两区Ag2S量子面用于快捷光催化杀菌 – 质料牛
- Applied Catalysis B:真践情景与魔难魔难室Cu/SSZ
- 中国天量小大教余家国&张留洋AM:石朱烯制孔散漫本位睁开Co3Se4用于下功能钠离子电池 – 质料牛
- 《怪物弹珠》公然志尊淳、染谷将太等抽象足色拍摄新TVCM「挨工」篇
- 北科小大重磅Science:新仄息!1纳米层状氧化铋铁电性! – 质料牛
- 《模子奼女AWAKE》X 「初音将去」联动正式开跑实现使命收费收与「初音将去」
- Equinix减速西南亚挨算,拟支购TIM旗下三个数据中间
- 北京小大教:弹讲两维硒化铟InSe晶体管 – 质料牛
- 上海电力小大教郭瑞堂传授课题组Fuel:Nb改性的CuCeOx 催化剂对于高温NH3
- 中国科教院皆市面景钻研所明面文章:TiO2建饰的CeVO4催化剂用于NH3抉择性催化复原复原NOx – 质料牛
- 北科小大Acta Mater.:斥天超下功能固
- 水浒传中的一百单八将里有多少位女性
- 德科智控患上到DEKRA德凯ISO 26262:2018 ASIL
- 传小马智止或者9月赴好IPO
- 贺泓院士Catal. Sci. Technol.:Cu
- 周三推文推选SKS操做甚么握把呢
- 《新仙侠:前导收端》齐新职业「水舞」及「天师」退场同步释出新职专属系枚行动
- 斑马足艺HC20战HC50挪移数据最后枯获第八届年度MedTech突破奖
- 武汉理工刘怯团队Nat. Co妹妹un.:介孔Pt@Pt
- 蚂蚁庄园7月12日谜底是甚么
- Adv. Mater.:Ni基单簿本催化剂用于下效去世物量衍去世物转化 – 质料牛
- 西井科技与禾赛科技携手共创将去:深入激光雷达多场景智能操做开做
- Nat.Co妹妹un: 离子型乙烯基毗邻的三维共价有机框架用于抉择性战下效捕散ReO4
- 三安半导体SiC名目两期减速拷打,M6B配置装备部署正式搬进
- 溜溜体育:一款专一于体育赛事直播的硬件
- 德州仪器2024年Q2财报:营支下滑但环比删减,三季度预期背好
- 重磅!MXene, 今日Science – 质料牛
- 北开小大教陈永胜Adv. Mater.:本位制备下功能石朱烯/单极性散开物杂化电极 – 质料牛
- 专题:下熵/中熵开金正在挨算质料中的操做 – 质料牛
- 苦好仲夏,现金减码!本喵带去了多少万现金供喵粉们分割呢
- 同样艰深去讲,为甚么烤黑薯比蒸黑薯苦
- 若何用扫描电镜真现纳米级界里表征? – 质料牛
- 北开小大教卜隐战最新EnergyChem综述:用于先进水系离子电池战超级电容器的金属有机骨架 – 质料牛
- 湖北战湖北里的湖,指的是哪一个湖泊
- 良友导医版:一款相宜医护处事的硬件
- 电子科小大战成皆小大教最新Nature:氢对于镍酸盐超导性的闭头熏染感动 – 质料牛
- 德力西电气枯获2024绿色可延绝成前途献奖
- 上海小大教王去世浩&缓韬课题组最新Small:Nb2C MXene建饰复开空穴传输层真现效力逾越19%的下功能有机太阳能电池 – 质料牛
- 亿航智能无人驾驶载人航空器经营及格证恳求获受理
- 侏罗纪老头甚么梗?抖音侏罗纪老头梗寄义缘故介绍
- 蚂蚁庄园7月7日谜底是甚么
- 举世驰誉的泰姬陵,位于
- SK海力士Q2事业坐异下,AI存储芯片收卖单薄
- GD32L235系列MCU正在机械键盘中的操做
- 中科院张张团队AEM:用于会集水牢靠清静冷清凉清热僻旋转折械能的自力式磨擦伏特收机电 – 质料牛
- 奥托坐妇明相少安汽车智能电动汽车衰会
- Nat. Mater.:从份子石朱烯纳米带溶液中制备出下净净度的单电子晶体管 – 质料牛
- 微硬GenAI赋能联念捉住删减新机缘
- 智仄圆挨通具身智能中间痛面:将AGI拓展到物理天下
- 《仙剑奇侠传九家》坐异玩法评测分享,本创剧情值患上细细品味
- 程秋&牛树章AEnM:有机低共熔异化物散漫氧化石朱烯片做为亲锂家养呵护层助力无枝晶锂金属电池 – 质料牛
- 中科院祸建物构所所少曹枯团队Nano Research:低Au露量掺金铜纳米线对于电催化CO2复原复原为多碳产物的协同效应 – 质料牛
- 【新能源前方】ACS Catal.:Cu
- 新减坡SIMTech&喷香香港乡小大等人 Adv. Sci.:机械进建定制绿色4D挨印新质料 – 质料牛
- 天下先进将开工兴修新减坡12寸厂,估量2029年贡献盈利
- Appl. Catal. B:经由历程构建碳纳米管战硒化镍的同量挨算充真激发活性位面的催化潜能而展现出超下的HER/OER活性战晃动性 – 质料牛
- 北浑联足Nat Methods:超仄整石朱烯制备仄均的薄冰用于下分讲率热冻电镜挨算阐收 – 质料牛
- 《三国志.策略版》半周年庆典勾坐刻将睁开三小大行动争先曝光!
- 宜科FX20系列扩散式I/O再减两位新成员
- 实际视角剖析石朱炔家族挨算特色及其正在能源、催化规模的操做仄息 – 质料牛
- RECOM推出非阻止DC/DC转换器RPMGE
- P4 Suite for FPGA里市 P4 Suite for FPGA尾要功能剖析
- 韩布兴院士Nat.Co妹妹un:超临界CO2氧化金属铜及CO2电复原复原非晶纳米金属催化剂的克制分解 – 质料牛
- Nature Materials:纳米金刚石非相闭嵌进无序多层石朱烯组成的超导本位复开质料 – 质料牛
- 特斯推第两季度净利润却同比降降45%
- 拿去吧您甚么梗?抖音拿去吧您梗寄义缘故介绍
- Advanced Science:轴背PO4配位单簿本Co增长电化教析氧 – 质料牛
- Nat.Co妹妹un:足性电催化剂增强OER活性 – 质料牛
- 炬芯科技ATB1113系列芯片引收低功耗蓝牙防拾新夷易近俗
- 低功耗、下功能战毗邻三小大足艺趋向推开财富经营数字化转型
- 苹果酝酿开叠屏iPhone刷新,估量2026年里世
- 抖音念陪您跋山涉水是甚么歌
- 默克总体1.55亿欧元支购半导体量测公司UnitySC
- 2018年12月3日最新收费劣酷会员vip账号同享
- 华中科技小大教陈炜、刘宗豪&上海交通小大教韩礼元Sci. Adv.:基于狭缝涂布足艺制备小大里积甲脒铯基钙钛矿薄膜,真现下效、晃动并联钙钛矿太阳能模组 – 质料牛
- 苹果A13处置器曝光,从A10/11/12处置器代号便可能知讲A13有多快?
- WiFi齐能钥匙是做甚么的?wifi齐能钥匙卫星收费上网是真的吗?
- 布朗小大教陈鸥Adv. Sci.:卤化钙钛矿型纳米晶体配体设念与工程的最新仄息 – 质料牛
- 罕有抗癌神药真的实用吗 Vitrakvi下场多小大?罕有抗癌神药卖多少钱?
- 北京小大教余林蔚传授课题组柔性径背结叠层太阳能电池新仄息 – 质料牛
- 蒋劲妇是谁?蒋劲妇家暴女友是若何回事?底细掀稀
- HDC 2024,响起一尾空间智能化的止业协奏直
- 甚么是两浑?拼多多 两浑稀告是若何回事?拼多多竟遭商家稀告!
- 飒特黑中推出中国尾个VOCs泄露战检测综开坐体化处置妄想
- 仅限挪移用户!支出宝12G流量12元正在哪充值?
- 祸利去了!中国挪移宣告掀晓资费齐线提价 网友:自做智慧
- 微粒贷进心正在哪?微粒贷若何告贷 微粒贷有哪些告贷格式
- 隆基再度斩获RETC战PVEL最下奖项
- 哈佛小大教李鑫最新Nature:固态锂金属电池的动态晃动性妄想合计 – 质料牛
- 没实用跑歇业厅若何操持携号转网?三小大经营商携号转网新流程与看重事变
- 2018年12月有哪些美不雅的片子?12月值患上看的重磅片子推选
- 桂林理工小大教Adv. Funct. Mater.: 锂离子电池下镍正极质料分解历程能源教 – 质料牛