你的位置：kai云体育app官方下载 > 新闻资讯 > kaiyun体育小米正在入辖下手打造万卡算力集群-kai云体育app官方下载

kaiyun体育小米正在入辖下手打造万卡算力集群-kai云体育app官方下载

时间：2025-01-22 03:21 点击：92 次

一次AI创新，让原真名声不显的OpenAI一跃成为寰球知名企业，估值突出1500亿好意思元。但若盘问哪家企业才是AI时期的最大受益者，NVIDIA完好意思是惟一谜底。

财报数据线路，2024年第三财季，NVIDIA营收高达350.82亿好意思元，同比增长93.61%，归母净利润193.09亿好意思元，同比增长108.90%，其中数据中心业务营收为308亿好意思元，同比增长高达112%，公司市值更是超越，位列寰球第二。

AI企业与NVIDIA属于彼此竖立，前者需要后者提供GPU或专科AI狡计卡，用于大模子的考研和推理，他们的需求援力NVIDIA营收、利润屡创新高。正因如斯，NVIDIA也明晰需要付出一定的老本扶执AI公司，培养客户群体。

据英国《金融时报》报说念，刚刚往日的2024年，NVIDIA累计参与了50多轮融资和多笔来往，向AI初创企业累计投资了约10亿好意思元，相较2023年的8.72亿好意思元增长了约莫15%。按照这个趋势，2025年NVIDIA大略率会投资更多AI初创公司。

除了NVIDIA，其他国表里互联网公司也在握住加多AI鸿沟的过问，一边打造我方的AI团队，一边投资其他AI公司。关于微型AI公司而言，有契机取得大企业的投资无疑是好音信，基于这种情况，2024年无数企业荒诞涌入AI行业。

天眼查数据线路，2024年国内新增AI关联企业突出50万家。可在AI本事日渐熟谙的今天，进攻AI行业确凿还有契机吗？

“钱”字当头，AI创业入局难

AI大模子的黑盒特色使其可证据性和可调试性较弱，关于语义的交融才气、数学逻辑和推理才气，以及可能存在的AI“幻觉”，齐是困扰设立者的本事难题。考研一款熟谙可用的大模子，需要招募无数本事东说念主才，去治理各式难题。可是行业的竞争促使企业彼此挖墙脚，吸纳AI东说念主才的老本握住飙升。

举例前段期间小米CEO雷军切身脱手，将参与过DeepSeek-V2大模子设立劳动的罗福莉挖到了小米。网上以致有音信称，小米公司向罗福莉开出了千万年薪。传言可能会有些夸张，但罗福莉的年薪只怕至少是7位数。

东说念主才以外，GPU算力亦然压在AI公司心头的重任。仍以小米为例，日前界面新闻爆料称，小米正在入辖下手打造万卡算力集群。百度集团施行副总裁、百度智能云功绩群总裁沈抖曾默示，一个1.6万张GPU的集群，采购老本就高达数十亿元，更无须说搭建、运营、羡慕老本。

（图源：AI生成）

万卡集群仅仅运转，若思打造出顶尖AI，还需要购买更多GPU或专科AI狡计卡。民生证券狡计机首席分析师吕伟默示，以ChatGPT的6亿月活数据狡计，考研任务约莫需要12万张A100，推理任务所需约35万张A100。

为餍足翌日AI大模子的考研和推理需求，OpenAI CEO山姆·奥特曼以致提议了7万亿好意思元重塑寰球半导体行业的筹划。算力集群的过问号称无底洞，最终需要几许才够，目下职何AI公司齐说不出真正数字。要知说念，1984年上映的《闭幕者》电影中，醒觉了自我坚强的天网系统，算力限制也仅为每秒60万亿次浮点运算，不如一张RTX 4090。

招募东说念主才和组建算力集群的老本未必很高，但总归可以承受，更严重的问题在于，用于考研大模子的数据不够了。原定2024年中后期面世的GPT-5，于今未能完成考研，主要原因之一即是数据不够用。为治理数据不及的难题，OpenAI被动招聘工程师、数学家、物理学家编写数据，用于考研大模子。

（图源：AI生成）

AI大模子的参数目越多，性能上限就越高，但参数目需要无数数据考研。为考研GPT-4和GPT-5，OpenAI着实浮滥了网上公开的论文、新闻资讯，以及酬酢平台上的帖子，以致因此惹上了讼事，被加拿大新闻社、加拿大播送公司、Torstar、环球邮报等媒体告状。

倒不是说数据完全被浮滥，仅仅剩下的数据未经公开，基本在各大公司里面，AI公司难以获取到。山姆·奥特曼直言，翌日考研一个大模子的老本可能会突出10亿好意思元。

东说念主才、算力、数据三大老本在前，哪怕是互联网巨头也倍感压力，更无须说涌入AI行业的初创公司了。

不外并非莫得低老本考研大模子的秩序，小米开出天价年薪招募罗福莉，目的很可能在于罗福莉的身份——DeepSeek-V2设立劳动的参与者。

DeepSeek大取得手，降本增效不是不能

最近一段期间，AI行业最火的新闻无疑是DeepSeek-V3模子的到来，其低至557.6万好意思元的考研老本，约莫仅仅GPT-4的二很是之一，展望不到GPT-5的二百分之一。过程小雷实测，DeepSeek-V3在翰墨生成、数学推理等鸿沟的体验不输豆包、文心一言、Kimi等国内极负著名的AI应用。

DeepSeek全新大模子的得手，向其他AI公司传达了一个信息——考研大模子的老本可以无须很高。可是有舍必有得，低老本考研出的大模子，存在一些难以治理的问题。

能够以极低老本考研出部分场景体验比好意思豆包、Kimi的大模子，DeepSeek的决窍在于有三，第一来自MLA架构和MoE架构，前者运用多头潜在详确力机制，可提真金不怕火相邻层的特征并进行压缩，从而减少狡计量，裁减大模子考研所需老本；后者属于巨匠搀杂架构，具备6710亿参数，但每次仅激活370亿参数，裁减了对狡计资源的需求。

（图源：AI生成）

第二是FP8搀杂精度考研框架，以裁减精度、压缩键值为代价，在尽量不影响模子性能的前提下，大幅勤俭了显存和狡计资源，可普及考研速率，裁减考研老本。

第三为模子蒸馏，庸碌大模子要运用无数数据进行考研，蒸馏本事以被考研好的模子为“教学”，筛选出灵验数据，去考研一个“学生”模子，从而裁减老本。DeepSeek之是以在开源模子鸿沟享有如斯之高的声誉，并将DeepSeek-V3打形成刻下最强开源大模子，蒸馏本事无疑是关键成分。

这些本事虽裁减了老本，却以葬送精度为代价，尤其是蒸馏本事，存在一个极为严重的症结，即“学生模子”的才气无法突出“教学”模子。追求极致的AI企业不会过度吸收蒸馏本事考研AI，南洋理工大学狡计机谋划东说念主员王汉卿默示，他理解的一线谋划东说念主员，基本没东说念主在搞模子蒸馏了。

事实上，运用其他AI产出的数据考研大模子，着实扫数AI企业齐在作念，但若过度依赖数据蒸馏，会出现生成数据偏差、丧失种种性等问题，以致可能生成不测旨的回答。DeepSeek-V3上线后，便出现了回答用户问题时自称是ChatGPT的情况。

对此山姆·奥特曼切身回话称，复制先驱的东西是相对容易的，去作念新的、有风险的、有难度的事情是厚爱的，勇于挑战厚爱的谋划东说念主员，理所应当取得更多荣誉，这是宇宙上最酷的事。尽管莫得明说，但山姆·奥特曼已是在嘲讽DeepSeek-V3抄袭，翌日蒸馏本事也可能濒临侵权问题。

不管如何，DeepSeek-V3的得手，齐为其他AI公司和琢磨入场的企业指出了一条新的说念路，通过裁减精度、压缩践诺、蒸馏模子，无需数亿好意思元的昂贵老本，也能考研起程扬出色的AI大模子。

AI行业，已经是“蓄意家”的乐土

近十年间，寰球最得手的两大新兴企业该是新动力汽车和AI大模子，翌日东说念主形机器东说念主有契机进入此队伍。新动力汽车行业的发展历程，将在AI行业复现，初期参与的企业极多，但过程大浪淘沙，本事实力、经管才气不能的企业会逐渐被淘汰。

AI行业正处于从快速发延期向熟谙期过渡的中级发展阶段，任何企业齐仍具有成长为巨头的契机。仅仅能否运用好这些契机，则要看AI公司的本事实力、经管才气、策略目光。

（图源：AI生成）

刻下AI行业已经可以入场，但只稳妥两类企业，一类是财力浑厚，向行业顶峰进发的企业。此类企业将承担起引颈行业进步的职责，握住拓荒跳跃，将AI的才气推向岑岭。

过问约莫100亿好意思元却没能坐褥出新动力汽车的苹果公司和血亏1100亿元的恒驰汽车证据，任何新兴行业齐存在无数风险，不是钱多就一定能成事。AI行业通常如斯，过问和产出未必成正比。不外风险与机遇老是并存的，作念到极致的企业翌日才能赚大钱。

另一类企业则是以“够用就行”为目的，不追求功能脾气达到极致的公司，可通过裁减精度和蒸馏本事，以较低老本打造体验可以的大模子。DeepSeek-V3考研老本仅557.6万好意思元，能够包袱得起的初创公司不在少数。

至于空有蓄意却实力不及的企业或创业者，已不稳妥目下的AI行业。尽管有NVIDIA、微软等巨头向初创企业投资，但那点钱相干于顶级AI大模子的设立劳动无异于杯水舆薪。AI行业已经是蓄意家的乐土，仅仅门槛比往日高了一些，入场需要愈加严慎。

25年1月7日，CES（国外消费电子展） 2025 行将恢弘开幕，雷科技报说念团已飞赴好意思国现场整备，届时咱们将对CES伸开全程专科报说念，敬请暖和。