2023 年人工智能商业化报告

用户从中受益

最近,生成式 AI 在各领域的应用展现出显著的生产力和性能提升。例如,在软件开发领域,诸如 GitHub Copilot 等工具明显加快了程序员的编程速度。在市场调研等任务中,AI 不仅辅助大幅缩短了完成时间,还提高了任务质量。

用户愿意为此买单

消费者和企业正在大量投资生成式 AI,这推动了新的产品和市场领导者的迅速崛起。尽管诸如 ARR 或年销售额等可比较数据有限,但总体趋势很明显:AI 应用的发展速度正在超过其他任何类型的软件。

现有的市场主导者也极可能会被超越

2023 年,大企业打破了“大公司病”的固有思维,迅速推出了一系列创新型的 AI 产品,这一举措不仅使得现有企业间竞争格局产生显著的变化,也吸引了一批初创企业加入这场激烈的竞争。

投资者都在期待 AI

越来越多的上市公司在电话会议中强调 AI,这与公司股票估值的上升相吻合。虽然这两者之中并没有一个明显的因果关系,但值得注意的是,许多高管和董事会成员,他们的薪酬主要基于股价,因此他们正将战略重点转向“AI化”。

接入专有数据

企业希望利用像 ChatGPT 这样的 AI,通过加入自己独有的数据使其更智能,创建独有的面向客户的产品。虽然 ChatGPT 很强大,但企业不能直接将其原封不动地进行销售。它们采用不同的方式将自有数据融入到 AI 中:明确告知 AI 具体任务、协助搜索、通过自身数据进行训练,或者从零开始打造一个全新的 AI。其中,RAG 最为受欢迎,因为它能让 AI 实时地利用最新的信息回答问题,并且即使有新的数据也无需进行重新训练。目前,最领先的方法是将 prompt 工程与 RAG 进行混合使用,并进行微调,但这两种方法并不相互排斥。

企业部署中面临的挑战

RAG 风靡一时:检索增强生成(RAG)已成为当前 AI 服务商关注的热门话题。在一些行业活动中,RAG 已经成为一些公司展台上的标志性口号。对于通用助手来说,现成的模型已经足够,但将专有数据融入其中可以使这些模型更具价值。在这方面,RAG 被认为是最佳选择。尽管对于特定任务来说微调模型是一种有效的方法,但并不适用于纳入新知识。与微调相比,RAG pipeline 工程使工程师更难以快速迭代。尽管人们对 RAG pipeline 的产品化感到兴奋,但如何以最佳方式对检索结果进行分块、索引、重排序和合成等棘手问题仍然是一个待解决的挑战。

上下文检索:在企业级部署中,尽管 RAG 表现出色,但往往涉及到成千上万的用户从不同来源访问文档的情况。对于面向消费者的聊天机器人而言,它可能会从一个通用知识库中提取信息,为大多数客户提供服务。但对于企业级知识管理助手来说,为了提供更多支持,需要更多的背景信息。具体而言,它必须了解用户正在处理哪些文档、可以访问哪些文档以及正在与哪些用户进行交互等等。这比索引整个 Google Drive 并供给任何人检索要复杂得多。在企业层面,上下文和权限感知的索引和检索变得至关重要。并非所有员工都能访问内部财务预测,也不是所有私人 Slack 消息都能被搜索到。

监测挑战:将实验结果转化为生产环境时,监控显得尤为重要。对机器学习模型进行监控并不是什么新鲜事,但对生成式 AI 模型进行监控就不一样了,因为它更为复杂。这主要因为 LLM 应用程序会生成大量额外的元数据,需要跟踪每一个提示链、检索和向量索引等。LLM 的强大之处在于其能够处理任何开放式对话,但这也意味着监控的范围相应扩大。即使所有记录都完备,对模型对话响应的评估仍然是主观的。目前,这是由人类手动评定的,而每个人都具有不同的主观偏好。在减少偏差(这在大规模管理上很难)、提高可解释性(虽然 LLM 具备自我解释能力,但有时可能过于“雄辩”或不准确)以及执行版权(检测器已被证明无效)方面,仍然存在一系列挑战。

定价方式

按点数(Credit)/按使用量定价目前是最受欢迎的定价方式: 一些软件公司已经公布了他们产品的定价。虽然这些公司采用了不同的模式,但大多数都使用了点数系统。有些公司完全基于点数/消耗量来定价,而其他一些公司则将其整合到核心产品的定价中。对于采用捆绑方式的公司来说,它们需要一个定价后台,以支持多种订阅和基于使用量的定价模式。

从基于使用量的定价转向基于用户的定价:我们注意到一些服务商,如 Notion 和 Jasper,已经从最初采用的点数系统模式转为为基于用户的定价系统。这种调整可能是对 OpenAI 通过 ChatGPT Plus 提供的无限制对话统一费率的一种响应。

基于价值的定价:Intercom 提供了一个有趣的实验,他们根据解决的问题数量为其 AI 聊天机器人定价。具体来说,在对话时,当客户确认最后一次与 AI 交互后,如果对答案感到满意或退出对话而无需额外的帮助,则计为一次。

P&P 示例:基于用户量定价(无点数体系

P&P 示例:基于用户量定价(有点数体系)

P&P 示例:以客户满意为基准

用户界面的演变

ChatGPT 在短短一年内就改变了技术对话语言的使用规范。最初,20 世纪 60 年代的命令行界面(CLI)作为最早的用户界面需要专业知识,从而将非技术用户排除在外。随着 20 世纪 80 年代苹果公司的 Macintosh 引入图形用户界面(GUI),计算技术得到广泛普及,开创了一个新的先例,而 2007 年 iPhone 的触摸界面延续了这一趋势。

ChatGPT 标志着自然语言用户界面(NLUI)的回归,不再采用复杂的命令行界面(CLI),而是采用用户友好的自然语言用户界面。早期的 NLUI,如 Siri、Alexa 和 Google Assistant,由于理解和响应能力的限制,并未能成为主流。相比之下,ChatGPT 以其超高的熟练度提高了人们对 NLUI 的期望,使其更加融入到日常的数字任务中。

生成式 AI 用户体验的三个维度

GenAI UX 案例:微软 365 Copilot

GenAI UX 案例:Adobe Photoshop

GenAI UX案例:Gmail Compose

GenAI UX 案例:ChatGPT

购买/销售 AI 的四个关键法律问题训练 AI 模型

AI 模型的好坏取决于它们所训练的数据。在训练阶段可以让模型学习并做出预测,会导致以下几种情况:

  • 不使用用户数据进行训练:AI 服务商严禁使用客户数据来改进或优化他们的模型。
  • 只为客户而训练:在这种情况下,尽管 AI 服务商可以利用用户数据,但这仅仅是为了专门提升该客户的 AI 体验。
  • 去身份化和聚合训练:AI 服务商可以使用客户数据,只要这些数据经过匿名处理并与其他用户的数据混合在一起。

知识产权(IP)

知识产权(IP)涉及到谁拥有输入到系统和系统输出的数据:

  • 输入所有权:用户输入到 AI 系统中的数据是否仍然是用户的知识产权,或者这些权利已经与 AI 服务商进行了共享或转让?
  • 输出所有权:由 AI 系统生成的结果,是用户所有还是属于服务商,或者是否授予了用户有使用权?

侵权

AI 领域的侵权行为通常涉及侵犯第三方知识产权:

  • 无侵权责任:AI 服务商不能保证他们的生成结果没有侵犯第三方内容,也不能确保不侵犯第三方的权利。
  • 侵权保护:AI 服务商可能提供针对潜在侵权索赔的担保或保护,保证产出的原创性或合法性。

限制条款

界定 AI 使用范围的准则,如:

  • 输出结果不能侵犯第三方权利,如复制受版权保护的内容。
  • 未经许可不能使用输出的结果来训练或改进其他 AI 模型。
  • 不能将 AI 生成的结果标示为纯粹由人类创造或是原创作品。

OpenAI 是新的科技巨头

除非受到像严格的法规、声誉问题或竞争对手的激烈行动等外部因素的限制,OpenAI有望成为下一个 ‘大科技’ 公司。去年,很难想象会有哪个理智的投资者会以 850 亿美元的价格购买该公司的转让份额。但早在 2022 年 12 月,OpenAI 就预测年收入将从 2022 年的 2,800 万美元增长到 2023 年的 2 亿美元,在 2024 达到 10 亿美元。

最近的数据显示,仅在 2023 年 9 月,OpenAI 就创造了 1.08 亿美元的收入。根据这一趋势,预计他们在 2023 年的前 9 个月就创造了约 6 亿美元的收入。OpenAI 有望在 2023 年实现 10 亿美元的收入。没有任何一家公司的发展速度能与之媲美。考虑到这一快速的发展趋势,以及公司快速推出产品的能力,包括在 Dev Day 上发布类似”应用商店”的消息,OpenAI 的估值达到 850 亿美元似乎是合理的。

OpenAI 开发者日:产品说明

更好的开发者体验问题:模型的输出不可预测的,难以将其用作两个系统之间的接口。

回复:JSON 模式确保 API 返回正确的 JSON 对象,从而在代码中更容易处理响应。可复现的输出使开发人员能够重新执行请求并获得一致的响应,从而实现更强大的测试和调试。

问题:构建工具和知识方面,GPT 模型存在一定的困难。

回复:Assistants API 提供了一些基础构件,可以扩展助手的知识和功能。开发人员可以利用诸如 Code Interpreter 和 Retrieval 之类的工具,将助手连接到外部数据源和计算资源。

可扩展性

问题:GPT 模型价格昂贵         

回复: 将 GPT-4 和 GPT-3.5 的 API 接口成本降低 2-3 倍,同时还提升了每个模型的性能(例如,增加了更多的上下文和最新的知识)这是在今年早些时候将 GPT-3.5 的价格降低了 10 倍的基础上的额外措施。

全新的消费体验

问题:ChatGPT 的知识过时了。

回复:知识更新至 2023 年 4 月,并将继续对模型进行更新。

问题:无法上传 PDF 或文档供 ChatGPT 阅读。

回复:现在可以了,而且不再需要在 ChatGPT 模型之间切换(例如数据分析、搜索)问题:想定制我的 ChatGPT。

回复:现在可以了,通过自然语言进行定制。

Meta 的 Llama 是一种防御战术

Meta 采取了一项大胆且有影响力的举措:“伪开源”了 Llama 模型。虽然一些组织发布了功能强大的开源模型,但 Meta 通过与最大的云和硬件服务商合作,构建了一个以 Llama-2 为核心的生态系统,使其可以随时用于生产和实验。

为什么 Meta 会花超过 2,000 万美元而仅仅用于训练,并在其周围构建一个生态系统,尤其是当它的主要业务是提供广告服务呢?这个问题表明,将一个模型开源对于人工智能社区来说有好处,有助于研究、进行红蓝对抗、找出模型的问题并进行改进。

然而,天下没有免费的午餐。Meta 的竞争对手 Snapchat 在 2023 年 2 月宣布有 7.5 亿月活跃用户。而 Llama-2 许可的规定是,如果月活跃用户超过 7 亿,就必须向 Meta 申请许可。
很显然,这是为了减缓 OpenAI 以及其他公司的发展速度。Llama-2 是 GPT 和 Claude 模型的有力竞争者。通过提供一个可配置的基础模型作为替代选择,用户就不必默认选择 OpenAI 或 Anthropic。

旧金山是热门地区

旧金山被誉为”脑力谷”(Cerebral Valley),因为这里汇聚了众多黑客、初创企业和共享办公空间,是 AI 社区的聚集地。每个工作日都有三场以上的 AI 活动。由 Outset Capital 主办的名为”周四 AI 之夜”的系列活动每次都在不同的地点举行。

在获得投资最多的 20 家美国 AI 公司中,有 11 家位于旧金山。在旧金山投资的著名 AI 公司和投资者案例:

  • 据报道,Anthropic 计划接管之前是 Slack 总部的整个 25 万平方英尺的建筑。
  • OpenAI 最近从 Uber 手中转租了两栋建筑,总面积达 48.66 万平方英尺。
  • 初创公司 Pear VC 最初在帕洛阿尔托运营,最近签署了一份合同,从 Dropbox 租赁了 3 万平方英尺的空间。
  • 微软在加州街 555 号开设了 AI 联合创新实验室。

活跃的 AI 投资者

知名生成式 AI 公司开始退出

大型企业为了提升他们的产品质量,并在市场上保持领先地位,开始纷纷收购 AI 公司。这些收购方愿意支付高昂的价格,比如 Databricks 以 13 亿美元收购 MosaicML。尽管这在 AI 工具领域可能有一些炒作,但即使是相对保守的大型企业(如汤森路透),也表示愿意出资收购 Casetext。

OpenAI 正在涉足各个领域去年,当 OpenAI 发布 ChatGPT 免费时,激怒了一位最大的客户和早期支持者—— Jasper。尽管 Jasper 是为解决其他营销工作流程而开发的,但 ChatGPT 却颠覆了许多通用的写作工具。现在有一种类似的情绪,认为 OpenAI 的新产品将扼杀另一批初创公司,这种情况并不陌生。

随着平台的成长,它的应用领域也在不断扩大。回顾 iPhone 的应用商店,它一开始也依赖外部开发者提供功能,这些功能后来也都被 Apple 整合到了自己的平台上。谷歌的安卓生态系统也有类似的情况。

投资主题:AI 工具

AI 的认知模型

人工智能的发展一开始是关注解决单一任务的算法,但现在已经转向了基础模型,以实现通用人工智能的目标,使得人工智能更接近人类智能的表现。我们可以借鉴认知科学的心智模型历史,来帮助我们理解人工智能的发展。

  • 感知:人类通过解释感官数据来感知周围环境,而 AI 感知则通过计算机视觉和自然语言处理来处理数字数据输入。 
  • 工作记忆:在人类活动中,工作记忆用于处理任务的临时数据存储;在 AI 中,它类似于系统的 RAM,即时处理数据,就像 LLM 的上下文窗口一样。 
  • 程序性长时记忆:人类执行无意识的熟练动作;在 AI 中,这是由嵌入式算法模仿的,能够自动执行动作并模拟反应。
  • 陈述性长期记忆:人类将事实和经验存储在记忆中,而 AI 则使用数据库和知识图谱来存储和检索信息。
  • 运动功能:人类的运动技能涉及行动规划和物理执行;在 AI 中,这被转化为与外部环境的数字化软件交互。 
  • Orchestrator:这是 AI 独有的组件,它整合了其他元素,管理数据流和系统操作,对 AI 功能和输出的一致性至关重要。

Orchestrators 工具的机会

AI 领域中的感知、记忆和运动技能这几个方面已经有一些很强大的公司或者得到充足资金支持的公司在主导。

Orchestrators 之所以吸引人,是因为它们能够解决当前在合成、检索和上下文管理方面的限制。虽然这些领域还不够成熟,但它们对于下一阶段的 AI ,即 agents 至关重要。虽然 OpenAI 的 Assistant API 在一定程度上解决了这个问题,但初步结果表明它目前只能执行一些简单的检索。

投资主题:AI 应用

推动职业专业化发展

劳动力市场的演变可以看作是专业化的演变。这种专业化是由于知识的扩展和对专业知识的需求所驱动的。技术的复杂性和对专业知识的需求是推动这一趋势的两大力量。以软件开发为例,在这个领域,开发人员的角色已经被进一步细分为前端、后端和全栈开发人员等专业职位,每个职位都需要对特定工具有深入的了解。在数字营销领域也有类似的情况,专业人才进一步细分为搜索引擎优化专家、内容策略师或社交媒体经理等角色。

与生成式 AI 相似

在生成式 AI 领域,专业化体现在根据特定领域数据进行训练的算法上。以医学为例,通过在医学期刊上进行训练的 AI 相比通用模型更能准确地生成医学见解或诊断。这种垂直领域的 AI 就像专业工人使用的专业工具一样,将成为该领域专业人士的有力助手。就像专业工作需要深厚的知识、工具和工作流程来为其特定领域提供定制服务一样,生成式 AI 应用也需要对领域有深刻的理解才能表现出色。

低数字化但专业性强的交叉领域机会

一些初创企业专注于改进那些数字化程度低但专业性强的工作领域,这些工作通常具备防御性和投资价值。现在,这些领域的颠覆时机已经成熟,因为它们通常依赖传统的人工流程,而 AI 能够为这些流程带来显著的效益。以专门用于法律合同分析的 AI 应用为例,通过对数千份法律文件的训练,该应用能够识别、解释甚至提供建议合同条款。对于花费大量时间审查合同的律师来说,这将是一个不可或缺的工具。

*以上文章翻译自 Kenn So 的《Business of AI Report 2023》,如需原文,请与我们联系。

WF Research 是以第一性原理为基础的专业顾问服务机构,欢迎关注和留言!

微信号:Alexqjl

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注