【国泰海通通信】GTC Taipei Keynote速览:全栈芯片机柜组合、CPU、PC是核心看点0601 事件点评:GTC TAIPEI在北京时间上午11:00举办,我们观看并梳理要点如下: # 硬件端 全栈AI基础设施芯片能力。大会展示了Vera Rubin Compute Tray,Switch Tray,CPU Tray、Spx-6 CPO switch tray,Groq 3 LPX Tray,BF4 STX Storage Tray等机柜产品,并且表示Vera Rubin已经处于full production状态。 Vera Rubin NVL72:10x Lower Cost per Token Vera CPU:1.8x the agentic sandbox performance of x86 CPUs; Groq 3 LPX:35x higher throughput at low latency with vera rubin NVL72; Vera BF-4 STX:5x higher tokens per second; Spectrum-X 6 SPX Ethernet:1.6x higher AI network performance;视频提及TSMC、Foxconn、Lumentum、SPIL、TFC等供应商; Vera CPU:AI时代的CPU。CPU原来是为人类做的,现在为Agent而生。CPU在rubin用在三个地方,一个是vera rubin compute tray 有2个CPU,用来组织和管理GPU,kv cache,处理软件和运行;一个是在BF-4有2个进行应用,快速的连接存储;还有一个是CPU Tray。Agent 四代,CPU成为GPU利用率的瓶颈,需要在效能和带宽间取得平衡。 Vera CPU:88 Olympus Core,PCIe Gen 6 CSL3.1;164MB L3 Cache;3.4TB/s Core-to-Core Bisection Bandwidth;1.5TB LPDDR5X Memory;NVLink-C2C 1.8TB/s Coherent CPU0CPU和CPU-GPU连接界面; 早期使用者为OpenAI,Anthropic,SpaceX 重新发明电脑。Nvidia和微软一起重新发明电脑,主要发布了并采用了RTX Spark,包含Blackwell RTX GPU芯片,采用了3nm工艺,700亿个电晶体;同时与MTK定义的20核Grace CPU;128GB统一内存,600GB Nvlink C2C连接,然后可以支持英伟达全栈工具:CUDA,Tensor RT,NVFP4,Ray Tracing,DLSS等;与Dell、微软、联想等电脑厂商一起合作笔记本,以及工作站等。 # 工具和Agent端 包括Chip Design Super Agent(与Cadence等合作);发布Nemotron 3 Ultra模型(550B);COSMOs模型继续推介来满足AI数据不足的要求;机器人方面发布了Isaac GROOT Reference Humanoid Robot板载计算和全栈GR00T软件套装,包括与Unitree合作身体控制,和GR00T 1.7模型等。 【国泰海通通信】余伟民/王彦龙/黎明聪