硅基流动(SiliconFlow)近日完成总金额近亿元人民币的天使 + 轮融资。本轮融资由某知名产业方领投,跟投方包括智谱 AI、360 和水木清华校友基金等知名企业及机构,老股东耀途资本继续超额跟进,华兴资本担任独家财务顾问。
本轮融资不仅是对硅基流动技术实力和市场前景的高度认可,也将为其未来发展提供强劲动力。创始人兼 CEO 袁进辉表示:“非常感谢各位投资方对硅基流动的信任和支持。这次融资将帮助我们进一步加快产品创新,为开发者提供触手可及的 AI 云服务,促进 AI 应用层的繁荣,推动 AGI 技术普惠化。”
近两年,生成式 AI 和大模型技术爆发,使得 AI 基础设施(AI Infra)成为市场的关键一环。
根据 Gartner 的报告,2023 年专用于 AI 工作负载的芯片创造近 534 亿美元的收入,占据了 AGI 产业中的大部分价值。而未来随着模型提升、架构改进和定制芯片等降本提效措施的实施,AI 应用的盈利能力将逐步提高,AI 应用层的价值将逐步显现,在这一进程中,离开发者最近的 AI Infra 生态位具备显著优势。
AI Infra 天然提供了应用开发者与硬件、模型之间的桥梁,不仅能提升开发效率和释放创新能力,还有效应对了市场对高性能和低成本 AI 解决方案的强烈需求。
历史一再证明,“得开发者得天下”,最接近用户的生态位能够最快响应市场变化和用户需求。硅基流动就瞄准了 AI Infra 生态位的机会,通过技术创新,大幅降低了 AI 应用的开发和使用门槛,凭借创新的技术和领先的产品,迅速崛起,成为 AI Infra 领域的重要玩家。
硅基流动成立于 2023 年 8 月,创始团队由国内人工智能领域的领军人物组成,具备全球顶尖的 AI Infra 技术能力。创始人兼 CEO 袁进辉是前 OneFlow 创始人及 CEO,曾任微软亚洲研究院主管研究员,发明了世界上最快的大规模主题模型训练系统 LightLDA,获得微软亚洲研究院院长特别奖。
硅基流动致力于打造标准化、超高效能的生成式 AI Infra 平台,产品支持全球最前沿的大语言模型及多模态模型推理。
公司自研的 SiliconLLM 大模型推理引擎,通过内核、框架、机制和模型协同优化,推理效率达到业内 SOTA,生成速度较同类开源产品快 10 倍以上,同时在 MoE(混合专家)架构、超长上下文、超低延迟等要求严苛、需求复杂的推理场景达到业界领先的产品能力。多模态推理方面,硅基流动开源的 OneDiff 推理加速引擎性能较开源同类产品性能提升高达 3 倍,已达到百毫秒级的端到端图片生成速度,用户体验可以达到 Prompt 实时生成。此外,硅基流动推理套件在 3090、4090 消费卡上推理性能表现优异,可以为开发者大幅降低大模型推理部署成本。
硅基流动近期发布了其一站式云服务平台 SiliconCloud(cloud.siliconflow.cn)
,平台提供高效能、低成本的多品类 AI 模型服务(MaaS),公测上线一个月便获得了爆发式增长,平台用户日均调用数十亿 Token,受到众多 AI 开发者和企业客户的青睐。
SiliconCloud 不仅上线了多款全球最新、最强大的开源模型,还通过自研推理引擎套件(SiliconLLM & OneDiff)大大降低大模型推理成本,为用户提供超高性能体验,用技术让开发者实现 Token 自由,助力开发者和企业聚焦产品创新,而无须担心产品大规模推广所带来的高昂算力成本。
截至目前,硅基流动的产品已经在包含大语言模型推理、文生图、视频生成等多个行业中广泛应用。此外,硅基流动还与国内外多家大客户建立战略合作伙伴关系,面向算力供应商、大模型厂商及 AI 应用厂商提供灵活、高效的 AI Infra 能力。近期,硅基流动也被业内顶级云厂商、芯片公司和大模型公司相继认证为最高等级合作伙伴,同时已携手多家标杆客户实现落地。未来,硅基流动也将探索与算力方和云厂商合作,以 AI 云产品服务广大的国内外企业。
耀途资本创始合伙人杨光表示:“生成式 AI 开启新一轮技术浪潮,ChatGPT 的出现标志着生成式 AI 应用在 C 端开始大规模普及,Llama3、Qwen2、Mixtral 和 SD3 等开源模型生态蓬勃发展,生成式 AI 的模型能力开始普惠化,模型能力已经逐渐不再稀缺。由于开源模型低成本、可定制、安全性强等特点,很多企业都在积极地拥抱开源模型。自 2024 年初参与硅基流动天使轮投资以来,公司技术持续突破,团队不断完善,耀途资本坚定看好 AI Infra 领域的创业投资机会,并长期寻找该领域优秀创业者,因此持续加注硅基流动,我们期待与硅基流动一同实现 AGI 普惠人类的愿景。”
智谱 AI Z 计划表示:“大模型时代,深度学习分布式架构等基础设施建设对于助力模型训练加速和模型推理加速至关重要。未来有越来越多的用户和场景将应用 AI 大模型,就需要性能、成本效益等方面实现更强优化。硅基流动团队在这个方向持续深耕多年,有扎实的技术积累和丰富研发经验。智谱 AI Z 计划愿意与他们一起为 ‘加速 AGI 普惠人类’愿景的实现而努力!我们也期待大模型 Infra ops 层的创新力量持续涌现,Z 计划也将坚定支持这方面的技术创新到产业落地,加速 AGI 的到来。”
360 投资总监向其奇表示
:“推理是大模型应用落地的关键环节。在资源受限场景中,推理性能和效率直接影响到模型的实用性。在大语言模型领域,基于丰富的 AI Infra 及加速优化经验,硅基团队自研了一套高性能 LLM 推理加速引擎,推理效率和性能实现了数倍提升。在图和视频生成领域,团队推出的 OneDiff 大模型加速库,实现了百毫秒级图片稳定生成,同时支持海量 AI 前端框架、算法和模型,大大降低大模型推理成本。随着开源大模型生态的快速崛起,团队推出了全新的云服务平台 SiliconCloud,指数级降低企业模型部署门槛,满足个性化部署需求,让企业及开发者能够以灵活低门槛的方式开发 AI 应用并迭代产品,实现了用户体验和成本的最优化。360 在 AI 大模型应用落地领域有着大量探索和丰富实践,将继续与硅基流动携手共进,加速实现 AGI 普惠人类的长期愿景。”
水木清华校友基金创始合伙人李竹表示
:“硅基流动所做的是 AI 大模型产业中非常重要的 AI Infra 层工作,国内有一批做模型算法、算力芯片公司,但是专注异构算力优化、调度的团队很少。袁博士是国内极少数坚持在这个领域深耕多年的专家和连续创业者。我们团队跟踪袁博士团队多年,很欣喜地看到他们在创业历程中的成长,我们相信硅基流动会成为中国大模型产业链中重要的一环。”
本轮融资标志着硅基流动迈入了发展的快车道。本轮融资后,硅基流动将携手算力方、模型厂商、应用厂商等行业上下游合作伙伴,进一步开展模型、系统、硬件联合优化和技术探索,并在市场推广、销售渠道、生态建设等方面广泛合作。
未来,硅基流动将继续专注于 AI Infra 技术的研发与优化,力求在全球 AI 基础设施市场中占据绝对领先地位,通过技术和产品创新让开发者实现 Token 自由,推动 AGI 技术普及与应用,真正实现人工智能普惠人类的愿景。
我们正在招募前后端技术研发、产品经理、市场、销售等各类人才,期待与你一起乘风破浪,探索 AGI 征途上的星辰大海。
本文分享自微信公众号 - OneFlow(OneFlowTechnology)。
如有侵权,请联系 [email protected] 删除。
本文参与 “OSC 源创计划”,欢迎正在阅读的你也加入,一起分享。
文章评论