随着人工智能产业的蓬勃发展,它会对环境造成什么影响?
ChatGPT无法回答的一个问题是:你消耗了多少能量?
“作为一个人工智能语言模型,我没有实际存在或直接消耗能源,”它会说,或者:“与我的操作相关的能源消耗主要与用于托管和运行模型的服务器和基础设施有关。”
谷歌的Bard更为大胆。“我的碳排放量是零,”它声称。当被问及在创建和培训过程中所消耗的能量时,它回答说:“不公开。”
人工智能程序似乎是无形的。但它们是由世界各地数据中心的服务器网络提供动力的,这需要大量的能源和大量的水来保持冷却。
由于人工智能程序非常复杂,它们比其他形式的计算需要更多的能量。但问题是,很难确定到底有多少。
当他们竞争建立越来越复杂的人工智能模型时,像OpenAI(创建了ChatGPT)、谷歌和微软这样的公司不会透露训练和运行他们的人工智能模型需要多少电力和水,他们的数据中心使用什么能源,甚至他们的一些数据中心在哪里。
例如,Facebook的母公司Meta去年宣布,它正在建造它认为是世界上最快的超级计算机,名为人工智能研究超级集群(RSC)。但它不会透露超级计算机的位置,也不会透露它是如何供电的。
现在,随着科技行业匆忙将生成式人工智能融入几乎所有领域——从电子邮件和搜索到送餐应用和心理健康服务——行业专家和研究人员警告说,这项技术的不受限制的增长可能会以巨大的环境成本为代价。
“人工智能的指数级使用带来了对越来越多能源的需求,”人工智能公司Hugging Face的气候主管Sasha Luccioni说。“然而,我们看到人们使用生成式人工智能模型的这种转变,只是因为他们觉得自己应该这样做,而没有考虑到可持续性。”
Luccioni是少数几个试图评估创建特定人工智能模型时产生的排放的研究人员之一。
在一篇尚未经过同行评议的研究论文中,她和她的合著者计算了在超级计算机上训练“Hugging Face”自己的大型语言模型Bloom所需的能量;用于制造超级计算机硬件和维护其基础设施的能源;一旦启动,电力就会用来运行程序。他们发现,它产生了大约50公吨的二氧化碳排放量,相当于一个人在伦敦和纽约之间乘坐大约60次航班。
Luccioni和她的团队估计,Bloom的能源排放量比其他生成式人工智能程序要低,因为Bloom的超级计算机是由核能驱动的,不会产生碳排放。相比之下,有限的公开数据表明,仅在ChatGPT的GPT3模型的训练中就产生了大约500公吨的二氧化碳——相当于普通汽油动力汽车行驶100多万英里,研究人员指出。
Luccioni说:“对于ChatGPT的最新模型GPT4, OpenAI没有透露它训练了多长时间,在哪里训练,也没有透露他们使用的数据。”“所以从本质上讲,这意味着不可能估计排放量。”
与此同时,新的人工智能模型正变得越来越大,也越来越耗能。Luccioni说,更大的模型需要使用越来越强大的GPU,并且需要更长的时间来训练并使用更多的资源和能量。
更不清楚的是,在创建和使用各种人工智能模型时消耗的水量。数据中心在蒸发冷却系统中使用水来防止设备过热。由加州大学河滨分校的研究人员领导的一项非同行评议研究估计,在微软最先进的美国数据中心训练GPT3可能会消耗70万升(184,920.45加仑)的淡水。
在缺乏准确的公开数据的情况下,研究人员不得不根据微软自己报告的平均值,假设“用水效率”,即数据中心使用的能源与保持其冷却和运行所需的水的比例。
根据GPT-3训练的地点和时间,实际使用的升数可能会有很大差异——在炎热的亚利桑那州,需要大量的水来防止服务器过热,而在怀俄明州,一个中心可能会使用更少的水。特定数据中心的设计也可能极大地影响数字。一个中心可能会使用传统的空调,而不是使用耗水量大的蒸发冷却系统,这种空调用水少,但用电多。
谷歌成为第一家在全球范围内公布其用水量的科技巨头,但提供的平均数据掩盖了其数据中心对当地影响的重要细节。在与俄勒冈州进行了旷日持久的法律斗争后,俄勒冈州达尔斯市公布了数据,显示谷歌数据中心使用了该镇四分之一的供水。
加州大学河滨分校(UC Riverside)电气与计算机工程副教授任少雷(Shaolei Ren)表示,因为人工智能项目的用水效率可以用来猜测其计算能力,所以公司希望对其用水情况保密。“他们想给我们提供尽可能少的信息,”他说。
一般来说,公司倾向于在电力便宜的地方建立数据中心。随着谷歌和微软等大型科技公司努力实现净零排放目标,它们可能会特别有动力在太阳能或风能资源丰富的地区建厂,比如亚利桑那州,但水资源匮乏。
Meta和OpenAI没有回应《卫报》的置评请求。谷歌和微软拒绝公开回应。
当领先人工智能公司的高管们呼吁监管以防止人工智能带来的“生存风险”时,这引发了人们对超级智能对社会构成威胁的猜测。但研究人员警告说,更直接、更相关的风险之一是环境风险。
Luccioni说,如果公司在创建和使用人工智能模型时对使用的自然资源和排放的碳更加透明,他们可以帮助开启关于何时以及如何战略性地使用生成人工智能的讨论。在癌症治疗中使用生成人工智能技术可能值得付出环境成本,但在其他情况下使用它是一种浪费。
然而,生成式人工智能已经成为一种固定模式。Luccioni说:“有一种观点认为,如果你不使用它,你的公司就过时了。”
几个月前,OpenAI提供了将ChatGPT整合到他们的应用程序中的付费访问权限,包括在线杂货配送公司Instacart在内的公司正在使用该功能来定制杂货清单和配料推荐。上个月,谷歌宣布将把生成式人工智能(generative AI)整合到gmail和搜索中——使用指数级更复杂、能耗更高的技术来完成基本相同的任务。公司建议使用类似的工具进行银行欺诈检测,争议统计模型已经很擅长检测。
Luccioni说:“这很令人沮丧,因为实际上,多年来人们已经开发了许多低影响、高效的人工智能方法,但人们希望将生成式人工智能用于所有事情。”“这就像用显微镜把钉子钉进去一样——它可能会起到作用,但这并不是这个工具的真正用途。”
版权声明:
作者:zhangchen
链接:https://www.techfm.club/p/91491.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。
共有 0 条评论