品玩

科技创新者的每日必读

打开APP
关闭

谷歌 AI 宣布推出大模型基准测试 CardBench

2024年9月3日

品玩9月3日讯,据 marktechpost 报道,谷歌近日宣布推出大模型基准测试 CardBench,满足对学习型基数估计(cardinality estimation)模型的系统评估框架的需求。

ardBench 是一个综合基准,包含 20 个不同真实数据库中的数千个查询,大大超过了以往的任何基准。这样就能在各种条件下对学习到的万有引力模型进行更全面的评估。该基准支持三种关键设置:基于实例的模型,即在单个数据集上进行训练;零点模型,即在多个数据集上进行预训练,然后在一个未见数据集上进行测试;微调模型,即进行预训练,然后使用目标数据集的少量数据进行微调。

CardBench 的设计包括用于计算必要数据统计、生成真实 SQL 查询和创建注释查询图以训练 CE 模型的工具。该基准提供了两组训练数据:一组用于带有多个过滤谓词的单表查询,另一组用于涉及两个表的二进制连接查询。该基准包括 9125 个单表查询和 8454 个二进制连接查询,其中一个数据集较小,确保了模型评估环境的稳健性和挑战性。来自 Google BigQuery 的训练数据标签需要 7 个 CPU 年的查询执行时间,凸显了创建该基准所需的大量计算投资。通过提供这些数据集和工具,CardBench 降低了有兴趣开发和测试新 CE 模型的研究人员的门槛。

取消 发布

下载品玩App,比99.9%的人更先知道关于「谷歌」的新故事

下载品玩App

比99.9%的人更先知道关于「谷歌」的新故事

iOS版本 Android版本
立即下载
AI阅读助手
以下有两点提示,请您注意:
1. 请避免输入违反公序良俗、不安全或敏感的内容,模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务,但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时,您需要自行判断并承担风险;
感谢您的理解与配合
该功能目前正处于内测阶段,尚未对所有用户开放。如果您想快人一步体验产品的新功能,欢迎点击下面的按钮申请参与内测 申请内测