Mistral AI 与 Snowflake

f13e9af0-b9d7-440d-8ba3-60d137faa103

超越基础查询:在 Snowflake 上使用文本到 SQL 实现准确性提高 2 倍。

Snowflake 利用 Mistral AI 的大型语言模型 (LLM) 增强自助分析。

Snowflake 是一家人工智能数据云公司,帮助企业从其数据中获取更多价值,每天处理数千个客户的数十亿次查询,从而获得重要的业务见解。其结构化数据人工智能助手 Cortex Analyst 成功的关键在于与 Mistral AI 的合作以及集成了两种大型语言模型——Mistral Large 和 Codestral——选择它们是因为它们出色的自然语言理解能力和 SQL 生成能力。

通过利用 Mistral AI 的大型语言模型,Snowflake Cortex Analyst 实现了

  1. 准确性比最先进的大型语言模型提高 2 倍
  2. 准确性比其他竞争解决方案提高 14%
  3. 在客户评估中持续实现 90% 或更高的准确性

此次合作在生成式人工智能 SQL 产品中树立了用户体验的新标准,让非技术团队成员能够更轻松地快速利用自助分析。

背景

随着客户寻求访问结构化和非结构化数据中的洞察,对帮助解释数据的大型语言模型的需求正在增长。Snowflake 开发团队需要为 Cortex Analyst 提供一种解决方案,该解决方案不仅能够专业地生成 SQL,还能提供对话技能以实现高质量的自然语言交互。鉴于准确性对于数据团队和使用查询结果来指导关键业务决策的业务用户至关重要,该解决方案需要达到最先进水平并超越现有的评估指标。

“借助 Mistral Large 和 Codestral,Snowflake 正在为复杂细致的企业数据提供尖端的文本到 SQL 功能。”
Yusuf Ozuysal,Snowflake 工程总监

SQL:快速获取洞察的障碍

对于经常在企业环境中编写 SQL 查询的任何人来说,查找正确模式和理解复杂数据集细微差别的学习曲线可能很陡峭。更复杂的是,SQL 查询可能微妙且含糊不清,“正确”的答案可能不止一种写法。对于非技术用户而言,编写和优化 SQL 查询可能既复杂又耗时,因此无缝直观的用户体验对于推动不同用户群体的采用和满意度至关重要。

为了提供更快的洞察访问,Snowflake 希望通过高精度文本到 SQL 功能增强 Cortex Analyst。目标是开发能够处理复杂数据集、简化模式识别学习曲线并为非技术用户提供直观体验的高精度文本到 SQL 功能。最关键的是,Snowflake 需要确保达到最先进的准确性,以支持关键业务决策。

Codestral 和 Mistral Large:提供准确且具有对话性质的响应

Snowflake 需要生成一个 SQL 查询,评估该查询的准确性并修复任何潜在问题,然后以对话方式向业务用户提供查询和相关信息。Snowflake 转向了两种 Mistral 模型作为潜在解决方案:Codestral,一种专门为代码生成任务定制的开放权重模型,以及Mistral Large,用于推理、语言生成和代码生成。

为了实现强大的查询生成,Snowflake 采用了两步法:首先,请求多个代理生成 SQL,然后请求另一个代理根据专家响应合成最终的 SQL。Snowflake 使用 Mistral Large 和微调的 Codestral 进行初步的 SQL 生成,并使用 Codestral 合成最终的 SQL 响应。

Cortex Analyst 还需要使用任何用户(无论其技术专长如何)都能理解的自然语言,以对话方式呈现查询和重要的上下文信息。一个重要的考虑因素是根据可用数据识别含糊不清或无法回答的问题,并提醒用户或建议替代方案。

“Mistral AI 是文本到 SQL 生成的完美选择。我们的目标是在准确性方面超越现有基准。我们尝试了其他几种模型,但即使经过微调,它们也未能达到所需的执行准确性。”
Yusuf Ozuysal,Snowflake 工程总监

Mistral Large 对于提供 SQL 知识和对话质量至关重要。关于如何生成查询的额外解释和参考文档让用户对输出充满信心,并在需要时能够进一步研究。

选择 Mistral AI 的理由

Snowflake 选择 Mistral Large 和 Codestral 模型是因为它们

  • 出色的自然语言理解和 SQL 生成能力
  • 在代码生成和推理任务中表现强劲
  • 能够提供高质量的对话式解释
  • 与其他模型相比,在 SQL 专业性方面具有竞争优势

结果与影响:树立准确性和用户体验新标杆

结果令人印象深刻。基于内部评估集,使用 Mistral Large 和 Codestral 的 Cortex Analyst 始终比最先进的大型语言模型单次 SQL 生成的准确性高出近 2 倍,并且比市场上另一种竞争性文本到 SQL 解决方案的准确性高出约 14%。此外,Cortex Analyst 在客户评估和基准测试中可靠地实现了约 90% 或更高的准确性,这对于企业用例至关重要。

cc1ffad6-c91d-4536-97dc-24d0a792695e

除了数值上的提升,Snowflake 和 Mistral AI 之间的合作还在生成式人工智能 SQL 产品中树立了用户体验的新标准。它增强了非技术用户的自然语言交互,并提高了识别含糊不清问题和建议替代方案的能力。这次合作使 Snowflake 得以进一步兑现其为客户普及生成式人工智能并在其企业数据上交付价值的承诺。

展望未来:拓展数据分析的视野

随着 Snowflake 通过人工智能驱动的数据应用提高数据洞察的可访问性,与 Mistral AI 的合作开启了新的可能性。更高质量的输出带来用户满意度和采用率,使数据团队能够自信地使用最先进的解决方案构建业务应用,而无需面对构建和维护内部模型带来的准确性、延迟和成本挑战。

Snowflake 和 Mistral AI 之间的合作仅仅是提供客户快速、有洞察力地访问数据旅程的开始,使各行业企业的自助分析更加便捷和高效。

要详细了解全球企业为何信任 Mistral AI 的开放、高效且高性能的大型语言模型,请访问我们的客户案例:https://mistral.ac.cn/customers/