算力瓶颈下 这个芯片或将有一战之力
来源:中财网     时间:2023-04-18 19:46:58

人工智能三大核心要素,模型、数据、算力。


(资料图片仅供参考)

国信证券分析师最新文章指出,三者必须同步增加,比如当参数极限扩大的时候,数据量跟不上,就会出现模型“喂不饱”的情况,当数据量太大,参数,算力不够,有些数据又会被闲置,不能被读取,他们做过测试,参数增大8倍,数据量最好增大5倍,这样的关系最好。

其认为,若未来GPT5进入停滞期,可能会发生以下事情:

1)微软openai会马上推出大量惊艳的应用,迅速提升各行业生产力。

2)其它大厂会奋起直追,毕竟目前大家就落后两代,大概就2年时间。

3)对CV机器视觉的迭代会加快,因为CV泛化大模型刚刚面世,它离停滞期是比较远,特斯拉也表示机器视觉的潜力空间非常巨大。

4)算力层面,当大模型更新升级停滞在某个阶段,应用又爆发的时候,ASIC芯片可能有一战之力,最典型的代表是google的TPU,把推理阶段某些算法嵌入芯片,当应用足够多,销量上升,摊销研发和各种前期费用,AI的ASIC芯片可能会爆出1-2款推理芯片对英伟达的竞品(但训练阶段,英伟达gpu依旧是王者姿态,没办法)。

这里面,我们重点来说一说ASIC芯片。

什么是ASIC芯片?

ASIC(Application Specific Integrated Circuit),即专用人工智能芯片,是针对某一领域优化的定制化芯片,因其以特定需求为核心,因此具备体积小、功耗低、成本低及性价比高等优势。

具体来看,其架构和指令集针对人工智能领域中的各类算法和应用作了专门优化,以使芯片在计算精度降低的情况下更耐用,这意味每一个操作只需要更少的晶体管,同时用户能得到更正确的结果,ASIC每瓦能为机器学习提供比所有商用GPU和FPGA更高的量级指令。

以ASIC的典型代表谷歌的TPU为例,它是专门为深度学习领域而定制的芯片。

因为它能加速其人工智能系统TensorFlow的运行,而且效率也大大超过GPU,谷歌的深层神经网络就是由TensorFlow引擎驱动的,其第四代张量处理器(第四代TPU的性能是第三代的2.7倍)是专为机器学习由谷歌提供系统设计,执行每个操作所需的晶体管数量更少,自然效率更高。

华泰证券表示,AI芯片的竞争格局已趋白热化,尽管各类具有不同功能和定位的AI芯片在一定程度上可实现互补,但同时也在机遇与挑战并存中持续调整定位。

AI训练端,英伟达的GPU凭着高算力的门槛,一直都是训练端的首选。但华泰证券也认为,当算法开始稳定和成熟,ASIC定制芯片,凭着专用性和低能耗,在一定程度上也能承接部分算力。相较之下,推理端对算力的要求比训练端要低,市场需求更大也更为细分,除了目前主流的CPU外,ASIC等芯片也能占到一席位。

市场格局方面,国金证券表示,ASIC的典型代表是谷歌TPU和寒武纪思元AI芯片,除此之外各大云厂商、互联网厂商,如从百度AI业务分拆而来的昆仑芯,阿里平头哥,特斯拉以及比特大陆等也纷纷涉猎。

德邦证券指出,目前全球ASIC领域呈现百花齐放局面,虽早期ASIC芯片以谷歌TPU为代表性产品,但如今中国ASIC厂商已实现加速追赶,显著缩小国内外产品技术差距与应用表现。国内主要生产厂商有寒武纪,澜起科技等,其中澜起科技PCle 5.0/CXL 2.0 Retimer芯片已实现量产。

标签: