“我错了,我对此负责。”2022年11月,扎克伯格在给员工的信中这样说。
属于元宇宙的高光时刻仅存在了短短几个月,还没等到元宇宙成为“移动互联网的继承者”,从2021年9月开始,Meta的股价一路下滑,一度缩水高达70%。
2022年11月底,美国人工智能公司OpenAI推出聊天机器人应用ChatGPT,其后不到半年时间,谷歌、百度等国内外大型科技企业纷纷投入生成式AI,百度推出文心一言,谷歌宣布向英美地区部分用户开放其聊天机器人Bard的访问权限。与此形成鲜明对比的是,微软、Meta、字节跳动等科技公司均已收缩VR/XR的团队,全真互联网、元宇宙的热度似乎逐渐褪去。
元宇宙怎么了,为什么在短时间内迅速崛起,又迅速被人“抛弃”?元宇宙还有未来吗?ChatGPT会步元宇宙的后尘吗?本期“聚焦”从不同角度解读GPT与元宇宙的差异。
热度是表象
实现元宇宙需要高度的技术集成
GPT与元宇宙“顶流”地位易主的一个原因是产业链的成熟度。
纵观人工智能产业链,基础层、技术层、应用层三个层次构成的全产业链已经打通。基础层范畴内的芯片、大数据、算法系统、传输网络等基础设施的加速迭代,技术层范畴内的计算机视觉、语音语义识别、机器学习、知识图谱、内容生成等关键技术的积累进步,应用层范畴内的工业、农业、医疗、机器人、智能驾驶、软件等行业应用的广泛落地,为产业链的发展和成熟夯实了基础,提供了技术支撑,打通了盈利模式。所以我们才会看到以GPT-4、文心一言为代表的内容生成式AI在今年一跃成为全球互联网“顶流”。
目光转向当下的元宇宙产业链,基础层的算力设施、传输网络、硬件生产,技术层的虚拟现实、数字孪生、区块链,这些设施、技术、硬件在发展水平、成本控制、落地推广等方面还面临着或多或少的问题,与规模商用的基准线仍存在着一定差距,这导致元宇宙在应用层面尚未取得实质性突破。行业巨头的产品“养在深闺无人识”,产业链打通的时间表“君问归期未有期”,元宇宙话题热度逐渐“偃旗息鼓”。
这是否代表着元宇宙仅仅是概念炒作缺乏实用价值?答案是否定的。
元宇宙发展之所以出现瓶颈,元宇宙产业链之所以不及人工智能产业链成熟,其原因在于人工智能是一个技术概念,而元宇宙则是一种平台概念,一个由规模庞大的技术集群构造的平台,包含通信、云计算、人工智能、XR、区块链、物联网、数字货币、人机交互等。元宇宙取得实质性突破,需要以这一技术集群的发展、成熟为前提。从这一角度来说,元宇宙无论内涵还是外延都高于人工智能。
元宇宙是现实世界的映射,它的终极目标是打造平行于物理世界,可与物理世界交互,最终超越物理世界的数字世界。元宇宙作为一种数字设施,将为人类社会带来一场数字变革。人工智能作为一项数字技术,则更强调工具属性,它给社会带来的影响更多地体现在生产力革命方面,工矿企业在产品质检、安全巡检等生产环节广泛利用人工智能以提高生产效率就是最好的例证。这在元宇宙中也不例外,虚拟人和语言文本的生成,为用户提供服务,都离不开人工智能技术的加持,人工智能是元宇宙不可或缺的关键技术,扮演着十分重要的角色。
GPT与元宇宙“冷热交替”反映出的不是概念的孰优孰劣,而是数字技术的螺旋上升过程。GPT大火之后,下一个登上“顶流”的数字技术尚不可知,但必须明确一个观点——技术的重要性不能用概念的热度来衡量。无论是人工智能还是元宇宙,实现突破性发展仍需要投入大量资金、人力,产业的成熟还需要一些时间。
成本是关键
GPT的使用“门槛”远低于元宇宙
最近,从朋友圈到微博、短视频平台,有关GPT的话题热度居高不下。用户向它提出各种问题:用鲁迅的口吻创作一首诗、某某代码问题如何解决、牛顿原理是什么……面对人类可能无法回答的问题,GPT都能对答如流。OpenAI官网介绍GPT为“优化对话的语言模型”,这款AI语言模型,让用户撰写邮件、论文、提案,创作诗歌、故事、脚本,甚至敲代码、写编程、检查程序错误都变得易如反掌。
随着GPT的火爆“出圈”,元宇宙似乎已经成了明日黄花。元宇宙已经被抛弃了吗?
GPT和元宇宙本质上是两个不同的概念。GPT确实产生了现象级的应用,但也仅仅是一个工具,类似搜索引擎的人工智能进阶版,它的迭代升级取决于算力算法和大量的数据库存储。而元宇宙可以看作是一种交互多媒体,它的进阶过程更依赖参与者的创造能力和交互反馈。这两种新概念都有无限前景,在用户使用门槛上,GPT只需具备互联网功能的设备,例如一部手机或一台电脑,就能实现操作应用,而元宇宙的应用则对硬件设备有更高的门槛要求。
在用户使用感知上,GPT的问答系统连接设备使用,可以在多个场景中发挥作用,例如在线客服、智能助手、语音交互等,通过模拟人类对话,与用户更加便捷地进行交流和沟通,以语言、文字问答形式为主,用户体验感稍显单一。而元宇宙在数字社交互动、娱乐游戏等领域有更大的发挥空间,元宇宙和现实世界之间连接主要靠硬件设备,越加先进的硬件会使得用户有更好的体验以及加速元宇宙产业链成熟化。
不同于GPT 需要大量的算力作为支撑,虚拟现实(VR)和增强现实(AR)是实现元宇宙的重要支柱,佩戴上辅助设备,用户就可以进入元宇宙的世界。作为连接现实世界与元宇宙的重要桥梁,近年来市面上推出了许多突破性的硬件设备,例如触觉手套、一体式VR头显、电子触觉皮肤、腕带式AR传感器、AR眼镜等。对用户而言,相较于ChatGPT,元宇宙的使用成本更高,市场普及率较低,是导致用户群远不如GPT的直接原因。
从用户体验的角度来看,GPT的进入门槛比元宇宙更低。但从长远发展来看,元宇宙更能满足用户多元化、个性化的需求,未来依然是重要的发展方向。如果把GPT的能力集成到元宇宙中去,或许能在很大程度上加速元宇宙的发展,促进元宇宙的真正到来。
技术是前提
人工智能赋予元宇宙“生命”
元宇宙在前两年大放光彩,曾被认为是Web3.0有可能的候选者,它面临的视觉、听觉和交互等技术难题都可以通过人工智能解决,虚拟场景的打造、数字孪生等功能的应用,也离不开人工智能技术的加持,近半年来,GPT持续火爆,元宇宙则被质疑是否已经“凉了”。
3月30日,在博鳌亚洲论坛2023年年会“下一代互联网”论坛上,小i集团董事局主席兼CEO袁辉向记者解释:“下一代互联网、元宇宙、人工智能,从普通用户的角度来讲可能是经常会混淆的,感觉每一件事情都是各自独立的,但实际上,无论是下一代互联网还是元宇宙,它的核心都是人工智能,这是一个很基础,也是很重要的结论。人类跟所有非人类的物理世界进行交流,支撑它的就是人工智能。”
为什么是人工智能?
“这里面有一个误区,看似ChatGPT只花了一两年,但实际上人工智能已发展了60多年,它是人类在人工智能领域长期的投入和研发,进行积累、变现的过程。近10年,芯片、带宽、算力、数据都已做了大范围整合,在所有要素具备的前提下,ChatGPT面世,这是一个厚积薄发的过程。”袁辉告诉记者。
构成人工智能的三大要素包括:数据、算法、算力,其中芯片的算力是最重要一环。训练GPT 需要使用大量算力资源。据微软官网数据,微软Azure为OpenAI 开发的超级计算机是一个单一系统,具有超过28.5万个CPU核心、1万个GPU和400 Gb/s的GPU服务器网络传输带宽。
然而,元宇宙的底层由基础设施与终端硬件设备组成,包括但不限于区块链、5G、6G、游戏渲染、画面渲染、云计算、AI、操作系统、工业互联网、DPU;从用户端来看包括路由器、传感器、芯片、VR头显、显示器、脑机接口等。
相比之下,GPT对于技术层面的要求更低,也更单一。
此外,GPT主要采用云计算的方式,将主要计算过程放在云端,根据自有算法和数据大模型计算后输出结果。云资源所提供的大模型训练的高算力、高存储和高可控空间,是未来人工智能发展的底盘。
从技术角度来看,AI推理能力的程序接口化在业界已经十分普及,如在云上部署一个推理服务器,让用户可以非常快速地获得图像和语音内容,这种模式在云计算发展的历史上已经被证明是完全可行的。当前,国内互联网厂商如百度、阿里、腾讯、字节跳动、京东、360等,都在密集宣布大模型技术进展及类ChatGPT项目计划,它们不仅在云计算方面有较强的实力,相比运营商云来说,还可以为客户提供较强的大模型,让客户可以将定制的大模型驱动的产品直接整合到自己的程序与服务当中。
虽然元宇宙同样离不开云计算,但GPT使用云计算的量级和元宇宙无法相比。元宇宙的“沉浸感”“低时延”“随地”特性不仅对VR/AR硬件技术和网络传输系统提出了很高的要求,还取决于高性能的云边计算能力和流媒体技术。作为一个全新的事物,元宇宙的成长和发展需要规模巨大的计算和存储能力支撑。更加真实、更加完整的体验也意味着海量的数据生产。现实世界的计算能力和存储能力直接决定了元宇宙的规模和完整度。这也为元宇宙的现实可行性打了一个大大的折扣。
如果元宇宙是一座房子,AI就是可信赖的看门人,始终确保一切顺利进行。
实际上,元宇宙中的AI让元宇宙更加智能,让用户能像真人一样在元宇宙里活动。AI还能增强元宇宙场景的互动性。总之,AI赋予元宇宙“生命”。
以AI为核心,元宇宙可以达到新的高度,创造出远超我们想象的沉浸式体验。AI驱动的NPC可以提供更高级别的交互——近乎实时地响应对话、根据用户行为做出决策,而复杂的算法确保虚拟世界不断发展以提供不重复的体验。
最重要的是,AI还可以帮助创建内容。随着用户创建更多内容,AI算法可以快速识别模式和趋势以生成新的交互式内容,例如故事情节或迷你游戏。借助大数据和强大的分析工具,我们很快就能拥有专门为每个用户量身定制的个性化体验。
应用是抓手
GPT和元宇宙各有千秋
随着人工智能技术的不断发展,GPT和元宇宙是目前备受关注的两个技术领域。GPT是一个人工智能技术驱动的自然语言处理工具,元宇宙是一种创建在区块链技术上的虚拟世界,提供了一个分散、交互和沉浸感极强的在线环境。
在应用场景方面,GPT和元宇宙各有优势。
GPT目前在多个领域获得广泛应用,包括客户服务、医疗诊断、语言翻译、自然语言处理和分析、编程等。GPT还可以在特定数据集上进行训练,这使它适用于特定领域知识的应用程序。GPT-4目前已经可以在SAT和律师资格等多项人类考试中获得理想成绩,并且可以进行角色扮演,设定引导用户思考的风格。
可以说,GPT的出现给各行各业的发展带来了机会,同时也在重塑各行业的结构。GPT具有理解和生成自然语言的能力,这使得它非常适用于客户服务、内容生成和个人助理等领域,作为生活、办公、教学辅导等场景的AI助手,提供信息查询、建议、推荐等服务,并有望彻底改变人们与技术的交流和互动方式。
元宇宙作为一种虚拟现实技术,期望创造一个全新的虚拟世界,适用于游戏、虚拟商务等领域,用户可以与虚拟世界互动而非进行自然语言对话。目前,元宇宙被广泛应用于游戏产业。例如,一些在线游戏平台已推出基于元宇宙的游戏,让用户可以探索和体验一个完全不同于现实的虚拟世界。元宇宙为用户提供了一个分散、交互和沉浸感极强的在线环境,用户可以在元宇宙中创建自己的化身,并参与各种活动如游戏、购物和社交等。元宇宙被认为是在线社交互动和娱乐的未来。
在未来应用场景方面,元宇宙在电子商务领域有很大的潜力。理想的元宇宙将由不同参与者共同创造,没有股东、高管、员工之分,不同参与人员共建、共创、共治、共享。元宇宙商业模型将由内容创作者驱动,贡献丰富多彩的内容。元宇宙自带经济体系,多部署在以太坊等公有区块链上,这保障了元宇宙的原生数字资产及其交易可信、不可撤销。在元宇宙提供的分散且安全的在线购物环境里,用户可以在不用担心货币兑换和支付安全问题等情况下购买来自不同国家和地区的产品。此外,元宇宙还可以通过分析用户偏好和行为数据,为用户提供个性化的购物体验。
然而,元宇宙在经历了“一夜爆红”之后,技术瓶颈依然存在,目前沉重的沉浸式设备使得体验者很难长时间停留在元宇宙空间中。
元宇宙在应用场景上的优势在于沉浸感和互动性,GPT相对于元宇宙的优势在于实用性和可访问性,且能够适应不同的领域。
GPT和元宇宙并不是完全独立的技术,它们也可以相互结合,实现更加复杂和丰富的应用场景。例如通过使用GPT技术为元宇宙中的虚拟角色和NPC提供更加智能和个性化的交互体验,也可以使用元宇宙技术来创造更加真实和沉浸式的聊天体验,使GPT的应用场景更加多样化和丰富化。
GPT和元宇宙都是当前备受关注的技术领域,并且在未来的技术世界中都将发挥重要作用。尽管它们的应用场景和优势不同,但它们都代表了人工智能和虚拟现实技术的最前沿。未来,随着技术的不断发展和应用场景的进一步扩展,这两种技术将在更多的领域和应用场景中得到广泛应用,为用户带来更好的体验和价值。