技术融合
AI
随着数据不断发展的计算系统和软件能够解决复杂问题,实现知识工作的自动化,加速技术与各个经济领域的融合。神经网络的应用将比互联网的引入更具有重大意义,并有可能创造数十万亿美元的价值。这些系统在大规模应用时将需要前所未有的计算资源,而 AI 专用的计算硬件将在下一代云数据中心中占据主导地位,以训练和运行 AI 模型。终端用户的潜力显而易见:AI 驱动的智能设备将渗透人们的生活,改变他们的消费、工作和娱乐方式。AI 应用将改变每个行业,影响每项业务,并催化每个创新平台。
融合技术正在引发历史性的科技浪潮

人工智能处于技术催化剂的中心
从高到低,技术融合矩阵展示了技术之间的关系

AI的发展速度超出了预期

各项技术的进步可以相互融合并转变为巨大的新市场

这些技术对经济的影响是显著的

技术创新可能具有足够的颠覆性,主导全球股票市场的市值

对 AI 的预期
以下所描述的内容基于 ARK 对未来的预测。由于存在一些不确定因素,这些预测在未来可能无法实现。所提供的信息不应被视为投资建议,也不应构成任何投资决策的依据。
神经网络
- 2040 年预测:在海量数据的加持下,计算系统和软件能解决以往不能解决的问题,实现知识工作的自动化,并加速科技与所有经济程序的融合。随着成本的急剧下降,定制软件随着每一次 AI 模型的增强而不断改进,这将世界连接起来。学习系统迅速发展,改变每一个行业和地区,其影响力不亚于微处理器的问世。
- ARK对 2030 年进展期望:自 2023 年以来, AI 模型的训练成本已经下降了 4 万多倍,再加上 对 AI 硬件的积极投入,AI 的综合能力提高了约 60 万倍。有 50% 的知识工作者已经用上了 AI 软件系统,他们的工作效率平均提高了 9 倍。与其他软件产品一样,企业需要支付生产率提升的 10% 作为使用该软件的费用。
下一代云
- 2040 年预测:云工具训练的 AI 模型主导软件堆栈,软件将 AI 运行的世界连接在一起。促进神经网络训练的 IaaS、芯片制造商和工具制造商将迎来几十年的需求周期。软件开发普及,提供互操作软件层 API 连接的公司迎来前所未有的增长。
- ARK对 2030 年展望:1.3 万亿美元的 AI 硬件支出可以支撑 13 万亿美元的 AI 软件销售,使得传统软件毛利率达到 75%。对 AI 硬件的需求主要来自三类客户:IaaS、软件公司和 AI 基础模型服务商,这些客户预计将达到 20% 的现金流利润率,与芯片制造商相当。
智能设备
- 2040 年预测:AI 为家庭和出行带来了动力。有线互联网和 AI 驱动的基础设施在家庭和社会环境中普及,彻底改变所有媒体的内容分发方式。终端用户将以全新的方式与世界互动,他们的消费偏好数据催生新的商业模式和服务。商业和博彩深入到娱乐体验中,促成新的广告和内容变现形式。节目已经成为商店。有线电视将过时,因为数字内容和消费者偏好直接推动视觉内容的发展。有线内容让位于交互式体验,巧妙地融合到互动体验中,以 AI 为媒介的眼镜和耳机渗透到日常生活的方方面面。
- ARK对 2030 年展望:消费者在智能硬件上的支出持续增长,每位互联网用户年支出约为 60 美元。线上时间大幅增长,占休闲时间的一半,达 20 万亿小时。数字体验持续以低价变现,在线平台服务商每小时可获得 0.25 美元的收入。智能设备、娱乐和社交平台的总收入达到 5.4 万亿美元,其中广告和商业将占据 80%。
AI:推动全球智能化发展并重新定义工作
凭借在广泛测试中表现出的超凡能力,像 GPT-4 这样的 AI 模型会催生出前所未有的生产力。受 ChatGPT 的“iPhone”时刻的影响,企业正竞相利用 AI 的潜力。
AI 不仅将提高效率,还将受益于成本的迅速下降和开源模型的出现。我们预计到 2030 年,如果知识型工作者的生产力能够提高 4 倍,那么在未来 5 至 10 年内,实际 GDP 的增长可能会加速,并创新历史新高。
ChatGPT 令消费者欣喜,让企业感到惊叹
自 2017 年谷歌发明了 Transformer 架构以来,ChatGPT 在多年的发展进步基础上,促进了公众对生成式 AI 的理解。ChatGPT 不再只是开发者工具,其简单的聊天界面使得任何国家的人都能运用 LLM 的强大功能。2023 年,各企业竞相理解并部署生成式 AI。

AI 显著提升了生产力
像 GitHub Copilot 和 Replit AI 这样的编程助手是早期的成功案例,它们已经显著提高了软件开发人员的生产力和工作满意度。由 AI 驱动的助理正在提高知识工作者的绩效,有趣的是,这些 AI 助理对表现欠佳工作者的提升要比原本表现好的工作者更为明显。

各领域的基础模型都在不断改进
随着训练数据集的扩大和参数量的增加,GPT-4 相较于 GPT-3.5 表现出了明显的性能优势。越来越多的基础模型实现了‘多模态’功能,支持文本、图像、音频和视频。不仅变得更加灵活和友好,性能也更为强大。

文生图模型正在重新定义平面设计
在多伦多大学的研究人员推出首个文生图像模型八年后,图像模型的输出效果已经能够与专业平面设计师的作品相媲美。相比之下,比如画一群大象穿过绿草如茵的田野,可能需要花费几百美元请一个人类设计师并耗费几个小时。而文生图模型只需几分钱,就能在几秒内生成类似的图像。专业软件如 Adobe Photoshop 以及消费级应用软件如 Lensa 和 ChatGPT 等,正在将图像模型整合到它们的产品和服务中。

文本创作的成本已经大幅下降
在过去的一个世纪里,文本内容的撰写成本按实际价值计算相对稳定。然而,在过去两年中,随着 LLM 写作质量的提高,文本内容的撰写成本也相应下降。

AI训练性能正在迅速提升
AI 研究人员正通过在训练、推理、硬件和模型设计等方面的创新提高 AI 的性能并降低成本。

训练成本会以每年 75% 的速度持续下降
根据莱特定律,加速计算硬件的改进会使每年 AI 相关计算单元(RCU)的生产成本降低53%,而算法模型的改进则会进一步使每年的训练成本降低 47%。换而言之,到 2030 年,硬件和软件的融合将使 AI 的训练成本以每年 75% 的速度降低。

随着生产应用案例的出现,AI的关注重点正转向推理成本
最初,研究人员专注于优化 LLM 的训练成本,而现在则更加关注推理成本。根据企业规模的使用案例,推理成本似乎正以每年约86%的速度下降,甚至比训练成本下降得更快。如今,与 GPT-4 Turbo 相关的推理成本已经低于一年前的 GPT-3。

开源社区正与私有模型展开竞争
面对 OpenAI 和谷歌闭源模型的竞争,开源社区及其支持者 Meta 正致力于普及生成式 AI。总体上,开源模型性能的提升速度比闭源模型更快,中国的模型在这方面也做出了贡献。

语言模型性能的提升需要细微的技术
从 SAT 到高级侍酒师考试,GPT-4 在标准化教育测试中表现优于普通人。然而,根据 WinnoGrande 的测试,GPT-4 在常识推理方面的能力却不及人类平均水平。斯坦福大学的评估框架:语言模型的逻辑评估(HELM)是目前最全面、持续更新的评估方法之一,已对 80 多个模型进行了测试,涉及 73 种情景和 65 项指标。

LLM是否会因为数据不足而限制其性能?计算能力和高质量的训练数据似乎是提高模型性能的主要因素。
随着模型的发展以及对更多训练数据的需求,缺乏新数据可能会导致模型性能停滞不前。据 Epoch AI 估计,像书籍和科学论文等高质量语言 / 数据源可能会在 2024 年耗尽,虽然仍存在大量未开发的视觉数据。

定制化 AI产品应享有更多定价权
随着开源替代品的涌现和成本的降低,将 AI 定制到终端应用的软件服务商将更容易实现盈利。相反,简单的生成式 AI 应用可能会迅速走向商品化。

加速提高知识型工作者的生产力可能会带来数万亿美元的商机
预计到 2030 年,AI 有望使知识型工作中的大多数任务自动化,从而大幅提高普通工作者的效率。能够加速并实现知识型工作任务自动化的软件服务商将成为主要受益者。

*以上文章翻译自 ARK 的《BIG IDEAS 2024》,如需原文,请与我们联系。
WF Research 是以第一性原理为基础的专业顾问服务机构,欢迎关注和留言!
微信:Alexqjl