中科加禾第一代異構原生AI算力工具正式發(fā)布

YE 2024-07-22 11:43:24 0 0 0 生成海報

這套軟件工具兼容多種國產(chǎn) AI 芯片，為屏蔽芯片差異提供了高性能的統(tǒng)一接口，包含異構原生大模型推理引擎、異構原生微調(diào)引擎以及算子自動生成、轉譯工具三款產(chǎn)品。

7月20日，AI 基礎設施創(chuàng)業(yè)公司中科加禾正式發(fā)布了第一代異構原生 AI 算力工具——加禾異構原生 AI 算力工具。

中科加禾創(chuàng)始人兼 CEO 崔慧敏發(fā)布并介紹，「加禾異構原生 AI 算力工具」已經(jīng)在國產(chǎn)算力的 AI 基礎設施上發(fā)揮一定作用。它兼容多種國產(chǎn) AI 芯片，為屏蔽芯片差異提供了高性能的統(tǒng)一接口。在異構原生平臺的基礎上，AI 算力集群在大模型推理上的時延可以降低 3-74 倍，吞吐率提升 1.4-2.1 倍，能效比提升 1.46 倍，可支持 340B 參數(shù)量的稠密大模型，以及 640B 的 MoE 大模型。

據(jù)了解，這套軟件工具包含異構原生大模型推理引擎「SigInfer」、異構原生微調(diào)引擎「SigFT」以及算子自動生成、轉譯工具「SigTrans」三款產(chǎn)品。

中科加禾

其中， SigInfer 是一款跨平臺、高性能的異構原生推理引擎，不但支持服務器級的 AI 加速卡，還支持消費級 GPU。因此，它既可以部署于數(shù)據(jù)中心，也可以為各種端側設備實現(xiàn)加速。

作為異構計算的技術底座，通過 SigInfer 接入的不同 AI 算力，可以做到調(diào)用接口統(tǒng)一，平滑遷移業(yè)務應用。SigInfer 會在調(diào)用多種不同算力的同時進行多層次深度優(yōu)化，充分挖掘芯片算力的潛能。

它具備現(xiàn)代大模型推理引擎所具備的各種特征，如支持 API Serving、請求調(diào)度、Batch 管理、KV Cache 優(yōu)化、張量并行、流水線并行、專家并行、甚至多機流水并行等能力。

中科加禾表示，SigInfer 已經(jīng)支持了業(yè)界大部分的大模型結構。目前，SigInfer 已經(jīng)可以實現(xiàn)完備的推理引擎能力。其支持的異構加速卡集群可以靈活調(diào)度英偉達 AI 加速卡 + 國產(chǎn) AI 加速卡進行混合推理，最高可擴展至萬億級的大模型。

來源：機器之心

上一篇：無錫新型城市算力中心（濱湖分中心）首批智算資源正式啟用，無錫市算力調(diào)度平臺上線！

下一篇：國家數(shù)據(jù)局：10個國家數(shù)據(jù)中心集群算力總規(guī)模超過146萬標準機架

發(fā)表評論

国产精品视频网址|久久机热国产自偷自|欧美一级中文一级|久久久无码日韩视频|欧美午夜激情影院|成人av不卡网站|色吧加勒比一本道东京热成人无码在线|欧美亚洲偷情|欧美老妇乱一区二区|亚洲一区二区网站

中科加禾第一代異構原生AI算力工具正式發(fā)布

相關推薦

發(fā)表評論

熱門閱讀

最新資訊

總投資超24億！青海省海南州...

加速布局！北京發(fā)布太空數(shù)據(jù)中...

電至兆瓦智算無界 | 20...

浙江嘉善：阿里巴巴143億、...

出席CDCC2025數(shù)據(jù)中心...

重慶市算力產(chǎn)業(yè)園揭牌暨渝中區(qū)...

總投資1.38億！海南儋州智...

高標準建設和林格爾金融數(shù)據(jù)產(chǎn)...