海螺新闻网
最新热点新闻

特稿|AI大模型热潮下算力需求爆发:临港欲建百亿产业,商汤当“链主”_自贸区连线

特稿|AI大模型热潮下算力需求爆发:临港欲建百亿产业,商汤当“链主”_自贸区连线

2022年1月24日,商汤科技在上海自贸区临港新区布局的人工智能计算中心AIDC正式开始运营。到那时,这家人工智能公司可能无法准确预测,2022年成为所谓的AIGC元年(AI生成内容)。

“今天,我们的AIDC港拥有近3万个GPU(图形处理器),我们目前的计算能力已经达到5000 PetaFLOPS(1 PetaFLOPS等于每秒1万亿次浮点运算)。在此基础上,我们相信未来会有更好的开发者效率,并且都可以支持更多千亿规模的大规模模型计算训练。”商汤科技董事长兼CEO许在6月2日的“AI引领时代,计算力驱动未来”——临港新区智能计算大会上表示。

据商汤报(www.thepaper.cn)记者了解,“还有很多需求在路上排队”。在商汤科技联合创始人、大规模设备事业群总裁john young看来,人工智能对更大数据、更大规模、更强计算能力的追求并不是“从今天开始”。“整个人工智能技术的迭代和进步的历史,可以看作是一种对‘暴力美学’的追求,是算法、算力、数据三要素从量变到质变的技术迭代过程。”

以前沿产业为主的临港新区对这一新热潮反应迅速。6月2日,临港新区党工委副书记吴小华在上述大会上发布了《加快临港新区计算产业建设生态行动计划》。根据规划蓝图,到2025年,临港将成为具有全国影响力的计算产业集群,包括相关硬件、软件、应用和服务在内的计算产业整体规模将超过100亿元。

临港新区党工委副书记吴小华发布了《加快临港新区计算产业建设生态行动计划》。

“我们看到,AI大爆发的时代已经到来,AI已经进入我们生产生活的各个领域。然后随着AI应用的爆发,实际上也带动了计算能力需求的爆发。”对于上述《方案》的出台,临港新区管委会高新处处长鲁宇对包括本报(www.thepaper.cn)在内的媒体表示,我们在临港前期有一个很好的优势,“就是我们的计算能力资源非常丰富。”

更重要的是,在人工智能公司选择是否登陆香港时,计算能力资源已经成为一个特别重要的决策因素。

计算能力是新时代的能量,成功不仅仅在于“暴力美学”

什么是计算能力?徐莉认为,计算能力实际上是整个模型能力的表现。“计算能力等于算法或者大模型的参数,乘以它处理的数据量。大模型时代参数越大,数据量倍增越大,需要的计算能力也越大。”计算能力已经成为新时代的能量。“某种程度上,计算能力决定了市场的竞争力。”

John young还表示,从去年到今年,整个人工智能领域有一个非常流行的概念叫做内容生成,同时大家也很熟悉一个名词叫做大模型。简单来说,这是一种“暴力美学”。例如,GPT-3模型使用超过1750亿个参数,需要高性能处理器来支持训练。使用V100训练是10000张卡14.8天,整体计算能力需求约625 PetaFLOPS。

约翰·杨认为,这种“暴力美学”也可以理解为量变和质变。“其实从诞生的第一天到今天,人工智能一直在通过规模化追求更大的智能。”他提到,其实在人工智能领域,过去5-6年,业内顶尖人工智能模型对计算能力的消耗“每4-6个月就会翻倍,也就是说过去几年翻了近30万倍。”

当然,“暴力”和“聪明”并不是完全成正比的。“拥有更大的资源和规模只是必要而非充分条件。”约翰·杨强调,正是每个环节的不断优化和完善,才真正支撑起“暴力美学”背后的巨大技术创新和成就。

以数据为例。“GPT-4使用的数据实际上只是OpenAI收集的所有数据的1%,因为他发现当更多的数据涌入机器人时,它可能就不那么聪明了。应该给这个算法提供更有效、更高价值的数据,然后才能创造出更聪明的大脑。”

它认为,至少在今天,数据的有效性远比数据总量重要。以及如何定义有效数据,“这其实需要数据科学家付出很多努力。OpenAI其实是让他们最优秀的科学家做数据,而不是大家想的那样。”

这种每一个环节的优化也包括计算能力。在NVIDIA缺货的情况下,为什么没有人用国产芯片做大规模商用培训?为什么Nvidia在最新一波到来后,第一时间把钱都赚了?这些问题背后的解释是,“并不是我们把计算能力堆到一个值就能产生最终的值。1000张卡和100台服务器放在一起运行同样的任务,需要大量的配套软件和通信网络。这是一系列软件和硬件的联合优化过程。我们过去没有做这样的工作,所以今天需要补课。”

临港利用这一趋势,加快了多计算电源系统的形成

据吴小华介绍,临港新区的计算力产业已经在上游软硬件、中游数据中心、调度平台、下游应用等方面进行了布局。目前,临港计算能力超过3Eflops (FP32,1Eflops等于每秒10亿次浮点运算),其中智能计算能力占近80%,计算能力规模在上海约占20%。

前述《方案》提出,到2025年,新区将形成以智能计算力为主体、基础计算力和超算力为协同的多元计算力供应体系,最终功率超过5EFLOPS(FP32),AI计算力占比达到80%。计算能力产业的整体规模(包括相关的硬件、软件、应用、服务等。)将超过100亿元,建成公共计算服务平台。

“智能计算能力是当下最火的AI公司所需要的。我们也发现AI公司来临港。他们不再只是关心给他多少政策支持,给他多少补贴。他会注意在这里着陆。能不能解决他的计算能力需求,因为现在市场上计算能力非常匮乏。”鲁豫提到了这个显著的变化。

据商汤介绍,截至今年5月,商汤大设备已服务超过40家核心客户。“特别是在大模型的浪潮下,我们现在支持10多家机构在临港的智能计算中心培训他们的大模型。”约翰·杨也提到了。

深石科技成立于2018年,是计算能力的需求方之一。由中国科学院院士鄂渭南等人领衔的公司核心团队,是“AI+Science”科研范式的先行者,其首创的“多尺度建模+机器学习+高性能计算”范式,实现了多尺度分子模拟中精度与效率统一的突破。

据论文(www.thepaper.cn)此前报道,深势科技已推出Lebesgue科学计算平台、Hermite药物设计平台、Bohrium微计算与设计平台。比如在医药领域,深势科技携手众多客户,将物理建模+AI的计算范式与临床前药物研发更广泛地结合起来。通过Hermite Uni-FEP、Uni-Fold、RiD等模块,结合自由能微扰理论、分子动力学、增强采样算法和高性能计算,准确预测蛋白质的结构和构象变化,高效地以化学精度评估蛋白质和配体的结合自由能,为药物研究者提供高效准确的理论。

去年12月29日,总部位于北京的深势科技在临港注册成立深势生物科技(上海)有限公司。神石科技政企事务副总裁刘在接受本报()采访时表示,公司在临港布局新一代分子模拟算法研发中心和AI辅助药物设计业务中心,主要是看到临港在大力发展计算能力。“我们在培养型号的过程中对计算能力有需求,另外临港要大力发展国产计算能力,我们也想在这方面有所贡献。”

从业务角度来看,“我们主要在临港布局我们的药物研发业务,包括研发我们自己的管道。”刘提到,神石科技的业务直接关系到临港乃至上海的人工智能、生物医药等主导产业。“我们愿意把我们的研发和产品带入临港的大生态圈。”

上述《方案》还提到,临港新区还制定了一系列保障措施,包括加强人才保护、完善扶持政策、推进开放合作等。据鲁豫介绍,AI企业来临港,将优先在临港提供智能计算能力,同时通过发放计算券的方式给予计算能力的优先使用。“即使是重点AI企业,政府也可以直接补贴其不超过30%的计算成本,我们都会拿出这些政策。”

值得关注的是,在大会现场,中国电信基于端口的公共智能计算服务平台和国产GPU联合创新基地也正式发布。中国电信成立了临港计算力(上海)科技有限公司,将开展临港计算力园区建设,批量投放4万台适用于智能计算和超级计算的大功率机架。

上海市经济和信息化委员会副主任唐文侃当天表示,当前,“以网络为基础、以数据为核心、以计算能力为关键、以安全为底线”的新一代信息基础设施已成为建设现代产业的重要基础支撑。上海提出构建“2+(3+6)+(4+5)”现代产业格局,对以计算能力为代表的新型信息基础设施建设提出了更高要求。

5月16日,上海市经济和信息化委员会公布了通过《上海市数据中心建设指南》合规性评估的数据中心项目名单,支持16个项目,其中2个项目位于临港。“截至目前,我委已支持商汤AIDC、富友网络、信息飞鱼等8个新项目,共计2.8万个6kW标准柜,占全市获批柜数的近五分之一。”

同时,唐文侃提出了其中一个建议,即利用港口附近丰富的计算资源,建设公共计算服务。“目前,靠近港口的上塘AIDC已接入公共计算服务平台。在此,也希望今天出席的各单位,尤其是电信运营商,结合临港的网络特点,积极在临港建设极速的计算力承载网络,帮助实现网络、计算力、智能的无所不在,推动计算力成为像水电一样的公共服务。”

建立智能计算产业联盟,商汤做产业链的链主。

基于现有优势和未来需求,临港希望打造上中下游一体化的计算产业联盟,进行协调、系统化发展。

鲁豫将临港的计算力供应视为整个产业链的“中段”,一端为落地临港的AI企业提供计算力保障,另一端涉及对计算力极其关键的“芯片、软件和系统”。“我们希望有一个需求端,有这样一个平台端,所以我们会把计算芯片企业、软件企业、系统企业聚集在这里,让他们深度参与到这样一个系统中来。

约翰·杨还强调,“今天看到的大模型的所有成果的发展,不仅仅是暴力的奇迹,更是人工智能三要素规模不断提升带来的技术价值的提升,更是基础R&D能力与系统的工程化能力、算法优化、数据整理与选择、平台计算能力优化的深度结合。这三者往往是相互联系的,很难把它变成一个单独的环节去单独做。”

他说,智能计算力产业链的重要价值在于,“只有链条上的企业多了,大家才能促进相互交流和思考,深入开展一些合作,才能在这样一个新的关键的、重大的技术浪潮中取得更好的技术进步和支撑。”

大会现场,新区智能计算产业联盟正式成立,联通担任联盟首任轮值主席。据悉,未来中国联通将在新区成立长三角创新研究院,进一步助力新区智能计算产业发展。

新区智能计算产业联盟成员代表由智能计算力、基础计算力、超级计算力中心等计算力提供商,GPU、FPGA、asic等计算力芯片公司,Big Model、AI for science等计算力需求公司组成,共25家企业,以及中国信通院华东分院等3所高校和科研院所, 西安电子科技大学和电子科技大学,未来将进行资源共享、技术交流和项目合作。 商汤科技荣获“新区智能计算产业链链主”称号。

GPU芯片制造商穆Xi当天表示,分别满足AI推理计算、AI训练/通用计算和高性能渲染功能的三类GPU产品将应用于AI推理、AI训练、数据中心、元宇宙、云游戏等领域,为各领域的转型发展赋能。

唐也对临港新区智能计算产业联盟的成立寄予厚望。“依托商汤科技等链主,结合自身优势,探索产业链上下游各要素协同,形成数字经济新的爆发点。”

在当天的会议现场,12家企业共同签署了新区智能计算产业上下游企业协同采购协议。鲁豫提到,新区还将发布协同采购正面清单。“如果企业在搭建本地化计算平台的过程中采购了国产GPU等上游产品,我们会给予补贴,这也鼓励了上下游企业更好的合作。”

责任编辑:孙扶校对:刘威

赞(0)
版权声明:本文采用知识共享 署名4.0国际许可协议 [BY-NC-SA] 进行授权
文章名称:《特稿|AI大模型热潮下算力需求爆发:临港欲建百亿产业,商汤当“链主”_自贸区连线》
文章链接:https://sourceopen.com.cn/7557.html

本站新闻文章由机器人程序自动发布,新闻内容具有时效性,仅供参考,不具备权威性,所有内容来源于互联网,并非官方发布信息,其真实性自行判断,不代表本站观点,如有侵权,误报,违法等不良信息,请联系删除.资源型信息仅供个人学习交流,请于下载后24小时内删除,不允许用于商业用途,否则法律问题自行承担。