软件业未来的三大预测

在科技领域，OpenAI 的发展呈现出一场类似《继承之战》的戏剧。Sam Altman 在短短 72 小时内完成了从 OpenAI CEO 到 Microsoft CEO 的转变，随后再次回归成为 OpenAI 的 CEO。

网上已有大量优秀的文章对此次事件进行了回顾。

本文将对 OpenAI 的本次事件进行批判性思考，探讨其对软件工程师及整个行业的潜在影响。

以下是三个观点：

1. 采用多模型战略将变得十分必要

多模型策略指的是单个组织或应用利用多个模型以满足其人工智能用例的实践。这种方法的优势在于当某一模型不可用时，可借助其他模型作为备选，从而提供安全保障。

这一策略与企业采用多云策略相类似。在大规模云服务的运营中，由于需要供应商高度冗余，多云策略相对更为合理。但是这对大多数公司而言不切实际，并且管理起来十分困难。相较之下，多模型策略更为必要且更容易实现，比多云策略也更实际可行。

与数据库有所不同，模型将变得更加“可切换”。数据库包含特定的数据，而模型则可在相同的数据集上进行训练和微调。随着大模型的不断发展，各模型的基准将趋于一致，而拥有最独有数据集的模型将保持最高水准（或者那些致力于解决合成数据问题的）。

这一观点得到了 OpenAI 的研究员 James Betker 的支持，他撰写了一篇引人入胜的文章：《AI 模型中的“她”是数据集》。

James Betker 发现，“模型的行为并非由架构、超参数或优化器选择所决定，而完全取决于数据集，除此之外别无其他因素。”

因此，当你提到“Lambda”、“ChatGPT”、“Bard”或“Claude”时，你所指的并非模型权重，而是数据集。

最终，绝大多数可用的数据集将对所有人开放。这也意味着绝大多数模型将达到一个“足够好”的基准性能水平，因而使用不同模型作为替代品将变得相当可行。

这同样意味着模型可能不再是壁垒。

本地模型的重要性逐渐凸显，拥有独立的数据、微调的模型和版本控制等优势。对于像 GPT-4 质量突然降低之类的问题变得不太令人担忧。

在云计算方面，如果采用托管后端即服务（BaaS）（如 Firebase 或 Supabase）与直接在 EC2 等服务器上部署的数据库进行对比。后者需要更多的维护和“DevOps”工作，但也提供更多的控制权。

2. 是否需要专门的人工智能基础设施和工具？

多模型策略日益重要的一个下游效应是对可靠的“人工智能基础设施”和工具的更大需求，以下是一些思考与发现。

OpenAI 事件促使一些个人或公司开始首次尝试本地模型，尤其是自 Meta 发布 LLaMA 以来，这些模型在质量和可用性方面取得了显著进展。此外，诸如 Google Cloud 等云服务商已经提供了 LLaMA 和 Claude 的实例。即使某个模型出现问题，程序仍能继续执行，但可能会降低结果生成的质量。

参见：Georgi Gerganov 的文献“在 AWS 实例中使用 llama.cpp”。

为了评估模型在 prompt 和用法方面的质量，人们将需要投入更多的基础设施。在对模型质量进行比较时，使用 LLM 的应用可能需要更深入的遥测（telemetry）、日志记录和备份等方面的工作，还需要考虑模型的 prompt 和用法等。

目前，这些方法只是将普通网页应用的基本原理应用到基于 LLM 的应用中。

相信最终我们会看到一些独特的人工智能基础设施，就像谷歌 / 脸书 / 亚马逊这样的公司在分布式系统上发表了具有里程碑意义的论文一样。

另一篇优秀的文章是 Latent Space 的《AI工程师的崛起》。

此外，在人工智能领域，可将“AI 基础设施”进一步细分为“跨模型基础设施”。

3. 像 LLM 这样的抽象层会增加更多工作，而不是减少

为了满足更好的人工智能或 LLM 专用基础设施的需求，以及由 LLM 的非确定性引起的一系列问题，我们可能面临更多的软件工作，而不是减少。像 LLM 这样的抽象层创造了更多可能性，但也因此导致了更多的工作。

目前还不能确定这是否是一件好事。

前端开发便是一个很好的例子。每一个新的前端开发框架都更倾向于将 DOM 的核心工作进行更多的抽象化，这使得如今的 Web 开发变得十分混乱。对底层技术拥有深刻的理解同时还能正确使用高级抽象层次是非常难得的，但这也将是成为优秀前端开发人员的必要条件之一（参见：Malte Ubl）。

如今，大多数软件工作都集中在应用层，因为较低层次的架构被抽象化隐藏了。

同样地， LLM 就像是对“真正工作”代码的一层抽象封装。虽然 LLM 正在将编码和样板代码抽象化，但那些对他们所使用的编程语言 / 框架有深刻理解并能编写代码的人，可能更有能力有效地引导 LLM 朝着正确的方向发展。

本文相信未来人们对软件的需求将持续增加。LLM 将成为生活中的一部分，并将催生出一个全新的工作类别（如建造人工智能基础设施），同时还将加速整体开发速度（同时带来一系列难以解决的问题）。

*以上文章翻译自《3 predictions on the future of software after AI》，如需原文，请与我们联系。

1. 采用多模型战略将变得十分必要

2. 是否需要专门的人工智能基础设施和工具？

3. 像 LLM 这样的抽象层会增加更多工作，而不是减少

Related Posts

AI 之镜 —— 软件业的 50 年

Coatue 最新 AI 报告

斯坦福大学李飞飞团队《2024 年人工智能指数报告》（摘要）

发表回复 取消回复

发表回复取消回复