关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

提供“百亿补贴”!无问芯穹发布大模型服务平台

2024.4.01

  3月31日,源自清华的创新企业无问芯穹在上海举办“多元计算·泛在链接”AI算力优化论坛暨产品发布会,清华大学电子工程系长聘教授、无问芯穹发起人汪玉携联合创始人团队首次集体公开亮相,并发布“无穹Infini-AI”大模型开发与服务平台。

  无穹Infini-AI大模型开发与服务平台基于多芯片算力底座开发,旨在有效整合和优化算力资源、设计出好的利用方式和工具,缓解大模型企业面临的算力紧缺状况。会上,无问芯穹宣布,该开发服务平台自3月31日起正式开放全量注册,并给所有实名注册的个人和企业用户提供百亿tokens免费配额。

  无问芯穹联合创始人兼CEO夏立雪介绍说,开发者可以在这个平台上体验、对比各种模型能力和芯片效果,通过简单拖拽各种参数按钮的动作,就能精调出更贴合业务的大模型并部署在无穹Infini-AI上,再以非常优惠的千token单价向用户提供服务。

  谈起发布这一平台的初衷,汪玉介绍说,大模型引发社会广泛关注后,他们认为,国内整体算力水平距离国际先进还有明显差距,仅靠芯片工艺提升或多元芯片的迭代已远远不够,需要建立一个大模型生态系统,让不同模型能自动部署到不同硬件上,让各种算力得到有效利用。

  据介绍,无穹Infini-AI已支持Baichuan2、ChatGLM2、ChatGLM3、ChatGLM3闭源模型、Llama2、Qwen、Qwen1.5系列等共20多个模型,以及AMD、壁仞、寒武纪、燧原、天数智芯、沐曦、摩尔线程、NVIDIA等10余种计算卡,支持多模型与多芯片之间的软硬件联合优化和统一部署。第三方平台或自定义训练、微调而来的模型也可以无缝迁移托管到无穹Infini-AI,并获得细粒度定制化的按token计费方案。

  “我们对模型品牌和芯片品牌的覆盖率还会持续提升,随着时间的推移,无穹Infini-AI的性价比优势会越来越突出。”夏立雪表示,未来无穹Infini-AI还将支持更多模型与算力生态伙伴的产品上架,让更多大模型开发者能够‘花小钱、用大池’,持续降低AI应用的落地成本。

推荐
关闭