探营腾讯混元大模型-世界球精选

2023-04-18 22:48:58 来源：阿尔法工场

目前，中国大模型领域的竞争，已经进入一个群雄逐鹿的乱战时代。

截止4月上旬，国内已有多家头部企业发布/或预发布了自己的大模型，其中包括了：

1、百度(NASDAQ:BIDU)的文心一言

(资料图)

2、华为的大模型盘古

3、阿里(NYSE:BABA)的大模型通义千问

4、商汤科技的日日新大模型

5、腾讯(HK:00700)的混元大模型

一时间，“寻找或成为中国的OpenAI”，成为了国内各企业最首要的问题。

虽然科技创新讲究的就是一个“快”字，但“快”也不是一味的。

如何在保证速度的同时，解决好资金、算力、数据、人才，以及更多未知的工程化方法，都是一个颇为考验“内功”的环节。

目前，互联网行业中的一些企业，已经在大模型领域展现出了自己的实力，比如阿里这类领军企业，但同时，还有像腾讯这样实力不容小觑的企业尚未发力。

腾讯作为互联网行业的领军企业之一，拥有强大的技术实力、丰富的数据积累以及AI基础设置，让其在AIGC领域的布局备受关注。

01 万亿大模型

自OpenAI发布Chatgpt以来，大模型领域一个明显的趋势，就是随着算力的发展，模型容量持续提升，模型通用性和泛化能力也更强。

然而，此前国内基于万亿大模型的应用探索极少，在高速网络、训练/推理框架、模型算法和落地应用等方面，也没有全面深入的公开性研究。

在这种情况下，作为头部企业之一的腾讯，自然动了欲作开拓者的野心。

然而，若要问鼎“万亿大模型”这枚王冠，强大的算力则是必不可少的。于是，腾讯设计的一套“先蒸馏后加速”的大模型压缩方案——太极-HCF ToolKit，就应运而生了。

太极平台，包含了从模型蒸馏、压缩量化到模型加速的完整能力，为AI工程师打造从数据预处理、模型训练、模型评估到模型服务的全流程高效开发工具。

由于太极框架封装了很多功能和验证，因此只要配置正确，就不需要再进行额外的测试。这大大加快了开放的进度。

以太极平台的基础，配合强大的底层算力与低成本的高速网络基础设施，腾讯打造了首个可在工业界海量业务场景直接落地，并投入应用的万亿NLP大模型——HunYuan-NLP 1T（以下简称混元）。

混元最快仅用256卡在一天内即可完成万亿参数大模型的训练，整体训练成本仅为直接冷启动训练万亿模型的1/8。

而腾讯之所以在训练成本上如此大费周章，则与其自身的战略布局有着密切的关系。

纵观混元在腾讯应用层、模型层的布局，我们可以发现，这样的布局策略，很有可能是想以统一的平台，实现技术复用和业务降本，支持更多的场景和应用。

而这样的技术复用和多场景支持，则与腾讯在互联网领域独特的生态位有着密切关系。

腾讯目前已有的互联网江山，涵盖了社交、游戏、广告、内容创作等多个领域，如何用最低的成本，为原先已有的众多产品和业务进行赋能和升级，就成了腾讯在AI时代首先要考虑的问题。

目前，腾讯已经打造了以混元 AI 大模型为技术底座的广告多媒体 AI 技术矩阵；以及应用于创作的智能创作助手；和通用游戏竞技的AI“绝艺”+“绝悟”。

可以说，这种通过降低模型训练成本，从而迅速让AIGC 技术为多个领域赋能的做法，与互联网行业发展初期，很多企业通过“烧钱”的方式，以迅速扩大市场份额的策略，着实有一种“异曲同工之妙”。

02 AIGC时代的新“微信”

“混元”对腾讯 AI 应用生态的拓展，绝不仅仅是一次对原有业务的“纵向升级”。

从某种程度上说，这样的生态的拓展，体现了腾讯在人工智能时代，对社会各领域、各产业层面的新一轮商业渗透的展开。

而这种多元化布局的思路，可以说是对其在移动互联网时代“攻城略地”的一次复刻。

在移动互联网时代，腾讯的野心就已经四溢到了游戏、社交、金融、广告等多个领域。这种多元化的业务布局，使得腾讯的触手深入到了网络生活的各个方面，并最终通过微信这个终端，一步步整合了人们对于衣食住行的大部分需求，以至于到了人们难以对其脱离的地步。

在当下的社会中，人们几乎无法想象没有微信的生活会是怎样的。

在进行多元化布局的同时，通过“烧钱”的方式不断投资并购，也是腾讯壮大自身的另一大手段。

如京东、美团、滴滴等，这些企业都是行业内的领先者，与腾讯的业务有很强的互补性，能够为腾讯带来更多的商业机会和收益来源，从而进一步扩大了腾讯自身的业务版图。

然而，随着互联网红利消失, 市场已经进入相对平稳的发展阶段，各大巨头们也开启了从增量到存量的战争。

在这样的背景下，传统的“花钱买量”已经难以再带来新的用户增长，既然原有产品的“纵向增量”已经走到尽头，那么通过跨领域融合的“横向增量”方式，继续维持或扩大自身庞大的业务版图，就成了腾讯若要在AIGC时代，一种最可行的策略。

凭借已有的庞大的用户数据，加上大模型带来的开放平台、生态合作，将自身的业务逐渐与农业、医疗、工业、教育等领域融合，可以最终编织成一张深深嵌入社会各个领域的智能化网络。

正如移动互联网时代，微信通过二维码、朋友圈、小程序等功能的推出，不断扩宽了自身的应用场景，并实现了用户数的一次次飞跃。

在人工智能时代，通过混元大模型带来的通用+专用领域的融合功能，意味着腾讯能够将各个领域的数据和信息进行整合和分析，混元大模型可以提供更加个性化、智能和高效的服务，从而进一步增强用户的忠诚度和粘性。

而当这些来自多个领域的信息、数据，最终被大模型整合进某一终端时，一个涵盖了人们各个不同领域需求的“AIGC版微信”，或许也就此诞生了。

在某种程度上，它可能会比现在的微信更“必要”、更“难以离身”，得益于大语言模型知识抓取、逻辑分析能力，一些涉及事项多、专业性强，并且与民众需求紧密相连的需求（如医疗、法律等领域），最后甚至仅仅能通过人们一句简单的“命令”，得到实现。

如此一来，混元大语言模型，从理论上可以打破腾讯的原有的产品版图边界，让AI连接起各个产品与用户之间的需求。

03 算力的边界

若要支撑起这样横跨各领域、多业务的大模型生态，一道绕不过去的坎，就是算力的限制。

尽管大模型概念持续火热，但入局者大多面临着算力之困。

市场上流传的调研纪要显示，要训练像ChatGPT这样的生成式AI，至少需要1万张英伟达A100加速卡的支持。目前，国内只有6家公司具备这样的硬件实力。

然而，这样的“算力边界”，并没能阻止腾讯在AIGC时代扩充自身版图的野心。

4月14日，腾讯云正式发布了面向大模型训练的新一代高性能计算集群HCCPNV5。

该集群采用最新一代腾讯云星星海自研服务器，并搭载了英伟达 H800 Tensor Core GPU（国内首发），提供业界目前最高的3.2Tbps超高互联带宽，算力性能比前代提升了3倍。

H800 Tensor Core GPU

一般来说，一个集群的性能，主要取决于三个要素：单机算力、网络架构、存储性能。

在单卡单机的算力上，新一代集群单GPU卡支持输出最高495 TFlops（TF32）、989 TFlops （FP16/BF16）、1979 TFlops（FP8）的算力，单卡性能爆表。

而得益于腾讯云星星海服务器采用6U超高密度设计，每节点支持8块H800，上架密度与同行相比提升了30%。利用并行计算理念，通过CPU和GPU节点的一体化设计，将单点算力性能提升至最强。

然而，仅仅有了先进的芯片，并不等于拥有先进算力。

原因在于高性能计算存在“木桶效应”，一旦计算、存储、网络任一环节出现瓶颈，就会导致运算速度严重下降。

因此，先进算力的背后是先进芯片、先进网络、先进存储等一系列的支撑，缺一不可。

此次腾讯自研的星脉网络，为新一代集群带来3.2T的超高通信带宽。在「星脉网络」的加持下，单集群规模支持4K GPU（最大支持10万+ GPU）、超EFLOPS（FP16）算力。

搭载同样的GPU卡，3.2T星脉网络相较前代网络，能让集群整体算力提升20%，使得超大算力集群仍然能保持优质的通信开销比和性能。并提供单集群高达十万卡级别的组网规模。

最后的存储问题，在大模型训练场景下，存储也经受着前所未有的考验。

几千台计算节点会同时读取一批数据集，需要尽可能地缩短数据集的加载时长。

而新一代HCC集群，引入了腾讯云最新自研存储架构，支持不同场景下对存储的需求。

例如其中的COS+GooseFS方案，就提供基于对象存储的多层缓存加速，大幅提升了端到端的数据读取性能；

而CFS Turbo多级文件存储方案，则充分满足了大模型场景下，大数据量、高带宽、低延时的存储要求。

如此一来，算力、网络、存储，三个关键的节点，都被腾讯一一攻克了。

随着新一代HCC高性能计算集群的发布，国内大模型训练面临的算力困局有望得到纾缓，而国内的人工智能生态，也有可能从此走向百花齐放的局面。

这是因为，虽然对于中国企业来说，虽然ChatGPT这样大模型，工作量和成本并不是不可接受，但只有在算力、算法、数据等不同环节，让众多公司构成了一个庞大的人工智能生态，量变引起质变，中国自己的世界级大模型，才会有“涌现”的基础。

说到底，ChatGPT不是OpenAI一家公司的成功，而是一种人工智能生态的成功。

随着混元大模型所带来的低成本训练红利，国内大模型多元化格局也有望就此形成，而由此构建出的人工智能生态，也将有望让ChatGPT这类AI发生在中国、根植在中国。

探营腾讯混元大模型-世界球精选

2023年4月18日浙江省丁苯橡胶价格最新行情预测-天天头条

2023年4月18日浙江省丁苯橡胶价格最新行情预测-天天头条

探营腾讯混元大模型-世界球精选

2023年4月18日浙江省丁苯橡胶价格最新行情预测-天天头条

OPPO A55 / A55s 5G 开放 ColorOS 13 安卓 13 正式版升级|微速讯

2023广州市荔湾区教育部门办幼儿园招生工作方案_天天通讯

头条焦点：榆阳公安分局组织召开禁毒工作会议

脚底水泡破了很痛怎么办_脚底水泡

爱角色胜过爱自己！94岁“国民奶奶”陈奇获奖|当前速读

龙葵是什么电视剧的角色_龙葵扮演者

中央财政向实际种粮农民发放100亿元补贴资金 统筹支持春耕生产

全球百事通！网贷不满12个月逾期提前还款会影响征信吗

全球观察：浙江卫视《国风·无双》特别节目今日播出

天天实时：清风正气朗乾坤

漯河民警紧急“上门”止付 捂紧群众“钱袋子”|世界新动态

每日看点!通宇通讯04月18日涨停分析

即日起至4月21日 0元预约抽送创维壁纸电视新品A7D

天天头条：衡阳市成立疾病分类与手术分类质量控制中心

无锡五一西水市集时间+地点 动态焦点

在抖音上加了个人微信说教学费就可以免费教短视频带货赚钱被骗怎

环球观速讯丨3月建材家居市场迎来“小阳春”！

华硕春季新品发布会定档 4 月 24 日 全球看点

12个月宝宝辅食食谱一天安排_13个月宝宝饮食安排表

环球短讯！泼水节被撕雨衣女生回应传言 不立案，到此为止就好！

每日视讯：详解勇士有多惨：刷屏热搜+多纪录证陷绝境 库里被批翻盘概率7.2%

世界快看点丨spread的过去式和过去分词_spread

斯威普防水无人机_关于斯威普防水无人机简介

每日热讯!心灵·机器交响曲：认知科学的跨学科对话

中建三局：数字赋能智慧城市|今日快讯

【环球聚看点】加码布局中国市场，中东富豪们开启A股“买买买”模式

环球动态:amp医学上是什么意思_amp quot 得成比目何辞死 愿作鸳鸯不羡仙 amp quot 是什么意思

唐晓翼渐冻症复发_唐晓翼死_环球看点

空姐年薪60万 空姐年薪 当前热闻

350字日记四年级（350字日记）_当前速递

如何调制鸡尾酒血腥玛丽?-鸡尾酒血腥玛丽怎么调制

瑞尔特：2022年净利润同比增长51.36% 拟10派2元|天天资讯

全球今热点：2023年宁波北仑消费券什么时候发券

ckplayer怎么使用_ckplayer怎么安装-动态

中信银行济南分行坚持党建引领 助力小微企业发展

【环球速看料】【财富】612亿元！美妆界最大赔款案落定

烤肠一根3元两根5元 女子报警称诈骗 具体情况是怎么样的？-天天速看

10年期国债期货主力合约显著下跌，收盘跌0.14%(04-17)

比亚迪超越大众品牌 登顶中国汽车销量第一 天天通讯

容大感光（300576）：该股换手率大于8%（04-17）_热资讯

世界讯息：湖州南浔文旅集团19.9亿元私募债券项目更新至“已受理”

全球聚焦：昆明产投225亿债务压顶，评级被下调

诽谤罪是指什么？诽谤罪在刑法中的规定都有什么？|天天新视野

百老汇正式停演35年音乐剧《剧院魅影》

滨海新区：聚力支撑引领 人大代表在行动 环球快资讯

姐姐的女儿我叫什么_爸爸的姐姐叫什么

党员组织关系保留时间一般不超过多长 党员组织关系保留时间一般不超过_速讯

全球连线｜在“中国抹茶之都” 看“世界抹茶超级工厂”如何生产

【天天时快讯】《生化危机4重制版》怎么存档方法[多图]

患慢性湿疹要怎么办？ 天天速讯

lol晋级赛赢几把晋级_lol晋级赛

黄油桶用什么清洗可以清洗干净 黄油桶用什么洗得干净

群葩当令时原文翻译和赏析_群葩当令时原文翻译

世界今日讯！04.17 上證指數、創業板指數 實戰技術應用

凯尔：多特错失大好机会，多一人作战还踢成这样真的气死我了

空间利用率达到69% 躺卧时与吉利豪同行 天天信息

天津建设电力“双碳”先行示范区

全球热讯:大连筑牢网络安全防线 护航数字经济发展

诺基亚e97i充电器_诺基亚e97

王维被称为什么之祖 王维有什么之称呢 每日热闻

世界动态:72.4米！广西发现中国岩溶地区最高树

环球头条：交通事故中交强险赔偿有哪些|天天新动态

天天动态:“五一”假期淄博再成顶流，“北京南-淄博”火车票开售1分钟售罄

万元买手机很难吗？中美日韩等 1 月销量 TOP 5：iPhone 完爆安卓

8.28万起售！2023款哈弗赤兔正式上市 官方推出4重礼|环球最资讯

天天快讯:瑞士梅花表价格是多少_瑞士梅花表价格

Win11 学院：在 Build 23435预览版中如何悬停任务栏打开搜索窗口 -精彩看点

消博会|国药国际周颂：国民健康消费需求远未被满足

德媒：聚勒因伤没去客场，多特中卫只剩胡梅尔斯&詹或再度客串

全球微头条丨华兰疫苗（301207）：4月14日北向资金减持4.15万股

快报：艾迪药业(688488.SH)：拟变更部分募投项目、用于“HIV高端仿制药研发项目”

爱我别上瘾_爱上了瘾 胡杨林

每日快看：管辖“全覆盖”，适用“从业禁止”——湖南法院持续加强知识产权司法保护力度

3月进出口数据分析：出口超预期有待观察，出口份额支撑全年韧性

第133届广交会规模创纪录 15日开展，展览面积和参展企业大幅增加|当前速讯

中央财政向实际种粮农民发放100亿元补贴资金统筹支持春耕生产

漯河民警紧急“上门”止付捂紧群众“钱袋子”|世界新动态

无锡五一西水市集时间+地点动态焦点

华硕春季新品发布会定档 4 月 24 日全球看点

环球短讯！泼水节被撕雨衣女生回应传言不立案，到此为止就好！

每日视讯：详解勇士有多惨：刷屏热搜+多纪录证陷绝境库里被批翻盘概率7.2%

环球动态:amp医学上是什么意思_amp quot 得成比目何辞死愿作鸳鸯不羡仙 amp quot 是什么意思

空姐年薪60万空姐年薪当前热闻

中信银行济南分行坚持党建引领助力小微企业发展

烤肠一根3元两根5元女子报警称诈骗具体情况是怎么样的？-天天速看

比亚迪超越大众品牌登顶中国汽车销量第一天天通讯

滨海新区：聚力支撑引领人大代表在行动环球快资讯

党员组织关系保留时间一般不超过多长党员组织关系保留时间一般不超过_速讯

患慢性湿疹要怎么办？天天速讯

黄油桶用什么清洗可以清洗干净黄油桶用什么洗得干净

世界今日讯！04.17 上證指數、創業板指數實戰技術應用

空间利用率达到69% 躺卧时与吉利豪同行天天信息

全球热讯:大连筑牢网络安全防线护航数字经济发展

王维被称为什么之祖王维有什么之称呢每日热闻

8.28万起售！2023款哈弗赤兔正式上市官方推出4重礼|环球最资讯

爱我别上瘾_爱上了瘾胡杨林

北京怀柔悦谷新城家园被投诉存在多个质量问题相关部门回应

今日视点：溜溜梅梅冻引爆全国糖酒会

金市健言：四面开花出击！纳指12825多！天然气2.01多！天天速看

清风头条丨嘉禾县：纪检骨干谋新局全力全速促发展_焦点滚动

关注：原神修罗场流云借风真君想要为申鹤和空牵线，唯一强烈反对的竟是甘雨！？其1

黄河发源地在哪儿啊黄河发源地在

Aki：输UP后我压力真的大，但不输UP不会改变那么多天天关注

天天最新：炭疽怎么读_炭疽怎么读拼音详细解释如下