Composo帮助企业监测人工智能应用的工作情况

人工智能和支撑它们的大型语言模型(LLMs)有许多有用的应用,但尽管它们的承诺,它们并不是非常可靠。

没有人知道这个问题何时会得到解决,因此我们看到,初创公司找到了一个机会,帮助企业确保他们支付的由LLM驱动的应用程序能够按照预期工作。

总部位于伦敦的初创公司Composo认为自己在尝试解决这个问题方面已经领先一步,这要归功于其定制模型,可以帮助企业评估由LLM驱动的应用程序的准确性和质量。

该公司类似于Agenta、Freeplay、Humanloop和LangSmith,它们都声称提供了一个更可靠的、基于LLM的替代选择,用于人工测试、清单和现有的可观测性工具。但Composo声称自己与众不同,因为它提供了无代码选项和API。这很值得注意,因为这扩大了其潜在市场范围 — 您不必是开发人员才能使用它,领域专家和高管可以自行评估人工智能应用程序是否存在不一致、质量和准确性。

实际上,Composo结合了一个奖励模型,该模型根据人们希望从人工智能应用程序看到的输出进行训练,并结合了一套特定于该应用程序的标准,创建了一个能够评估应用程序输出与这些标准相一致程度的系统。例如,一个医疗分诊聊天机器人可以让其客户设置自定义指南,检查红旗症状,并Composo可以评分该应用程序执行这一任务的一致性。

该公司最近推出了一个用于评估LLM应用程序在任何标准下的Composo Align的公共API。

这一策略似乎有所作用:它的客户群中有Accenture、Palantir和麦肯锡,最近还筹集了200万美元的前种子轮融资。尽管这里筹集的资金数额对于今天的初创公司的融资环境来说并不罕见,但这很引人注目,因为毕竟这是人工智能领域 — 向这样的公司投资是很丰富的。

但根据Composo的联合创始人兼首席执行官塞巴斯蒂安·福克斯的说法,这相对较低的数额是因为该初创公司的方法并不特别资本密集。

“至少在未来的三年里,我们不预计自己筹集数亿美元的资金,因为有很多人正在构建基础模型,并且他们做得很有效,而这不是我们的独特卖点,”福克斯说。“相反,每天早晨,如果我看到OpenAI在其模型中取得了巨大进展的新闻报道,这对我的业务是有好处的。”

凭借新的资金,Composo计划扩大其工程团队(由联合创始人兼首席技术官卢克·马克汉姆领导,他是Graphcore的前机器学习工程师),获取更多客户,并加强其研发工作。“今年的重点更多地集中在通过技术来扩展我们现有的技术,”福克斯说。

英国人工智能前种子基金Twin Path Ventures领导了本轮种子融资,其中还有来自JVH Ventures和EWOR的参与(后者通过其加速器计划支持了这家初创公司)。“Composo正在解决企业人工智能采用中的一个关键瓶颈,”Twin Path的一位发言人在一份声明中说。

这个瓶颈对于整个人工智能运动来说是一个大问题,尤其是在企业领域,福克斯说。“人们对激动的热情已经过去,现在他们在思考,‘实际上,这是否真的改变了我的业务现状?因为它不够可靠,也不够一致。而且即使它是的话,你也无法证明它到底有多少,’”他说。

这个瓶颈可能会使Composo对那些想要实施人工智能但可能会因此受到声誉风险的公司更有价值。福克斯表示,这就是为什么他的公司选择不受行业限制,但在符合法规、法律、卫生保健和安全领域仍具有共鸣。

至于其竞争壕沟,福克斯认为达到这样的地步需要进行研发并非小事。“这既涉及模型的架构,也涉及我们用来进行训练的数据,”他解释说,Composo Align是在“大规模专家评估数据集”上进行训练的。

仍然有一个问题,就是如果技术巨头们简单地利用自己庞大的资金库进入这个问题领域会发生什么,但Composo认为自己有先发优势。“另一个[要点]是我们随着时间推移积累的数据,”福克斯说,指的是Composo建立的评估偏好。

由于它根据一个灵活的标准对应用程序进行评估,Composo还认为自己更适应代理人人工智能的崛起,而不是那些采用更受限制方法的竞争对手。“在我看来,我们绝对还没有达到代理人工作良好的阶段,而这实际上正是我们想要帮助解决的问题,”福克斯说。