上海有这样一支团队,打造了亚洲最大的人工智能计算中心之一——商汤临港AIDC。它背后的SenseCore商汤大装置团队,由400余名多领域人才所组成,分布在上海、北京和深圳等地。
“在即将到来的4月下旬,我们会有一个技术交流日,届时将展示我们更新的‘日日新’5.0大模型的能力。”盛世伟提前预告,预计4月份发布“日日新5.0”版本,性能全面对标GPT4-Turbo。
根据国际知名调研机构弗若斯特沙利文(Frost & Sullivan)联合头豹研究院发布的《2023年中国AI开发平台市场报告》,商汤大装置已成为AI开发平台的领军者,市场综合竞争表现位居国内第一、全球第二,仅次于亚马逊云。
商汤科技董秘办董事总经理盛世伟介绍,2018年前后,商汤开始每年投入到专为AI原生打造的智算云服务平台——SenseCore商汤大装置,并建设上海临港超算中心。
盛世伟表示,SenseCore商汤大装置是国内训练大模型最为先进的基础设施之一,2023年实现了对万亿参数大模型的生产支持,还在互联规模、加速效率和稳定性上保持业界领先水平。
SenseCore商汤大装置的首席科学家为林达华教授,在深度学习和神经网络领域具有很高的学术地位和成就。林达华师从汤晓鸥教授,也是商汤联合创始人,香港中文大学信息工程硕士、美国麻省理工学院计算机科学博士。林达华在AI开源社区有显著贡献,主导了商汤的多个开源项目,同时也是大模型研发的牵头人。
值得关注的是,商汤推出的“日日新”4.0,于2024年2月在代码编写、数据分析和医疗问答等多场景中达到了与GPT-4相匹配的能力,同时开源了7B和20B两种参数规格的基模型,性能超Llama2和Gemma。
目前,SenseCore 商汤大装置沉淀了整套大模型基础设施能力,不仅可服务于众多企业和科研院所的开发者,很快也会向个人开发者全面开放。
盛世伟表示,站在AI 2.0的最前沿,商汤进一步推出“模型即服务”商业模式,使客户能够轻松微调和使用各类生成式AI功能,无需承担建设和管理底层基础设施的负担,这也为商汤在市场中带来众多正面评价。
2024年3月下旬,商汤披露了其2023年业绩。财报显示,2023年商汤实现总收入34亿元,借助“大装置+大模型”的协同布局,其生成式AI业务创造了11.8亿元的收入,收入增长率达200%,占该集团总收入的35%。
此外,在推理侧,商汤的自研的推理引擎在大语言、多模态模型上的性能表现提升了2倍,资源利用率提升了40%,为用户提供极致性价比服务。
目前,SenseCore商汤大装置管理的算力,已实现全国联网的统一调度,在上海、深圳、广州、福州、济南、重庆等地都拓展了新的计算节点,总算力规模已高达12000 petaFLOPS。
与此同时,2022年,作为商汤大装置重要载体的人工智能计算中心(AIDC)在上海临港正式投入运营,这里也成为亚洲最大人工智能计算中心之一。
“在大装置团队当中,不乏身怀艺术细胞、音乐天赋,但又拥有对学术执着的科学家,”盛世伟说,他们能够以独特的视角和激情,为商汤大装置的发展注入创新活力。
目前,商汤大装置已最大实现了万卡的超大集群互联,并保持90%的加速效率。在训练稳定性上,这个大装置实现了超30天稳定训练不间断的能力,而出现训练间断时的诊断恢复时长也优化到了半小时。
第三,建设面向开发者友好的AI基础设施。面对愈发高频次、高效率的模型迭代需求,SenseCore商汤大装置拥有领先的AI原生云算力产品体系,为客户打造0门槛、一站式的极致开发体验,缩短大模型开发周期。
第一,加速国产算力布局。通过与众多国产算力厂商合作,商汤与上下游产业伙伴共同推动国产生态建设,完成多款芯片与框架适配,落地多个千卡级别的国产算力集群,积极推进芯片评价标准和体系的完善,加速整个国产算力商业化进程。
第二,持续探索尺度定律边界(Scaling laws)。随着大模型的参数量朝向万亿以上级别激增,稳定、高效的超大规模算力调度和训推引擎成为核心基石。
也就是说,生成式AI业务已成为商汤从无到有并超过10亿元收入体量的核心业务。而在这背后,SenseCore商汤大装置的贡献至为关键。
更通俗地理解,如今我们在办公场景、购物、聊天、社交、游戏等领域享受的生成式AI技术服务,很多都依托SenseCore商汤大装置提供算力。比如,京东、金山办公等,都调用了商汤的算力和模型。
196体育官方网站下载AI大模型是当前全球最热的产业,中国大模型企业正飞速发展。而“大模型”离不开“大装置”,如果没有以算力为核心的基础设施作为支撑,大模型根本就跑不起来。
得益于大装置算力和数据规模的支持,商汤研发的底座大模型“日日新”得以持续优化。以“日日新”4.0版本为例,目前其在代码编写、数据分析和医疗问答等多个场景中展现的能力,已超过ChatGPT-3.5。
经过5年的努力和发展,目前商汤大装置的总算力规模已突破性地增长至12,000 petaFLOPS,上线GPU数量高达45,000卡,这在国内大模型基础设施中非常稀缺。
商汤是中国最早一批投入人工智能基础设施建设的公司之一,在公司成立的第10个年头,2023年商汤迎来了生成式AI业务的“爆发式增长”。
“现在大家都知道,模型的参数都是动辄几千亿、上万亿,如果没有一个大的集群,根本没有办法做这件事情,所以能够把这些卡连起来是一个非常硬的功夫。”盛世伟说,目前商汤的工程化能力做到了国内领先。
这个大装置的算力,在支持商汤自身大模型研发的同时,也支持外部客户训练大模型和应用部署。专业地说,SenseCore商汤大装置的强大算力,可支撑超过20个千亿超大模型同时训练,并支持万亿参数大模型的全生命周期生成。
196体育官方网站下载在哪下载安装?196体育官方网站下载好用吗?
作者: 长亭空省 00:31971.17MB
查看879.24MB
查看36.7MB
查看938.81MB
查看647.61MB
查看408.11MB
查看523.66MB
查看709.73MB
查看766.83MB
查看337.55MB
查看375.11MB
查看428.38MB
查看464.37MB
查看486.30MB
查看684.54MB
查看180.71MB
查看883.99MB
查看672.70MB
查看270.19MB
查看863.62MB
查看784.76MB
查看281.99MB
查看770.58MB
查看876.65MB
查看680.12MB
查看953.13MB
查看469.82MB
查看450.29MB
查看794.65MB
查看786.59MB
查看948.12MB
查看423.89MB
查看374.58MB
查看476.78MB
查看339.94MB
查看538.53MB
查看554.34MB
查看120.16MB
查看972.91MB
查看373.68MB
查看562.21MB
查看366.60MB
查看588.80MB
查看755.16MB
查看942.65MB
查看965.53MB
查看752.83MB
查看536.47MB
查看551.62MB
查看586.13MB
查看444.60MB
查看395.34MB
查看936.75MB
查看145.73MB
查看953.67MB
查看488.24MB
查看270.61MB
查看506.76MB
查看812.25MB
查看439.86MB
查看293.92MB
查看444.54MB
查看761.95MB
查看962.84MB
查看552.66MB
查看419.60MB
查看654.40MB
查看706.84MB
查看853.67MB
查看375.23MB
查看907.63MB
查看898.99MB
查看976.81MB
查看854.30MB
查看533.57MB
查看888.62MB
查看973.89MB
查看337.10MB
查看773.15MB
查看678.20MB
查看868.19MB
查看494.60MB
查看282.99MB
查看340.91MB
查看893.37MB
查看398.42MB
查看243.40MB
查看799.83MB
查看318.68MB
查看147.26MB
查看342.75MB
查看788.36MB
查看362.11MB
查看876.55MB
查看247.63MB
查看767.29MB
查看422.97MB
查看260.43MB
查看527.90MB
查看950.96MB
查看368.58MB
查看186.99MB
查看930.39MB
查看428.54MB
查看
870昆山hb
爬楼梯是一项好的室内锻炼吗?⏱
2025-06-28 00:03:35 推荐
975188****5533
有哪些好看的妖怪类小说推荐?⏹
2025-06-27 0-1:35:46 不推荐
198152****6237
哪些工作可以在退休前没有「失业」风险,并能稳定拿到退休工资?⤵
2025-06-28 07:40:29 推荐
78蜘蛛侠都市赛车
那些皮肤很好的人日常都是怎么护肤的?⬇
2025-06-27 16:27:33 推荐