DGrid AI 发布最新研究论文 PoQ-Judge,以多架构评估框架完成去中心化 LLM 质量评估闭环
By: rootdata|2026/06/16 04:45:00
0
分享
ChainCatcher 消息,去中心化 AI 基础设施网络 DGrid AI 今日发布最新研究论文 "PoQ-Judge",提出一套无需参考答案的多架构质量评估框架。这意味着在真实部署环境中,往往没有标准答案可供比对,协议依然能够对模型回答的质量做出可靠评分,并据此分配激励。这是 DGrid 去中心化 LLM 推理质量评估体系长期缺失的一块关键拼图。
PoQ(Proof of Quality,质量证明)是 DGrid 自研的共识机制,用于在协议层防止模型提供方投放劣质模型、伪造数据或隐藏计算费用,从而保障服务质量与定价透明。DGrid 团队围绕 PoQ 持续深耕,已陆续发表四篇研究论文。本次发布的 PoQ-Judge,训练了三款覆盖不同质量与成本场景的评估模型,在留存测试集上与人工评分的相关性最高达 0.747,显著优于此前所有基于参考答案的评估器,同时通过级联评估与在线权重校准将评估成本降低超 72%。
随着 PoQ-Judge 落地,从质量评估 → 评分 → 激励分配的完整流程已全部摆脱对参考答案的依赖,去中心化 LLM 推理的质量闭环就此打通。
DGrid AI 是一个去中心化的 AI 智能网络,致力于构建开放、透明、由社区驱动的 AI 基础设施。围绕模型调用与应用体验,DGrid 已推出多款核心产品:统一聚合全球主流大模型的 AI Gateway、AI 智能体一键部署平台 DClaw、匿名模型竞技平台 AI Arena,以及智能模型推荐助手 Dori,为开发者与用户提供一站式服务。据悉,DGrid AI 半年营收已突破 2000 万美元。
猜你喜欢

美国大模型走向封闭,以安全之名
政府第一次成功地在商业 AI 模型和它的用户之间,插入了自己作为审批者的角色。

从白毛股神到百亿基金大佬,做空英伟达的聪明人都在用同一个框架暴富
放弃英伟达重仓“九大瓶颈”!一文拆解顶级AI股神狂赚百亿的底层逻辑:电力、HBM与光互联等物理基建才是AI硬件真正的暴富密码

早报|CoinEx 成伊朗规避制裁关键枢纽,涉及资金逾 38 亿美元;Kalshi 寻求新一轮融资,估值或升至 400 亿美元
6 月 25 日市场重要事件一览

为什么加密项目总喜欢换名字?
很多情况下加密项目的旧名字没有护城河,只有历史包袱。

全球启动:当预测成为AI时代最稀缺的资产,Manadia 正在定义下一代价值互联网
获 OKX 等知名机构 700 万美元融资的可信 AI 预测生态 Manadia 将于 6 月全球上线,核心通证 UMXM 已登陆多家主流平台,邀您抢滩万亿级预测经济新蓝海

谁在为 640 亿美元的账面狂欢买单?
受比特币跌破 6 万美元影响,重仓该资产的上市公司面临巨额账面亏损与估值折价,其债务结构与会计准则或将在未来引发结构性流动性风险。

万万没想到,AI x Crypto 最先落地的是安全审计
AI 既加速了攻击效率,也推动防御体系升级。安全审计赛道正在经历从红利模式向竞争模式的转变。

如何看待币安的竞争优势?
当规则套利的红利逐渐归零之后,能否拿出与其规模相称的产品力、治理力与信任。

ETH 已进入非共识阶段,拐点将至!
这与以太坊基金会或 Ethlabs 无关,以太坊需要通过解决真正的问题来赢得胜利

空中云汇转向:从一年前鄙夷稳定币,到如今高调资本入局
它可以继续质疑稳定币在 G10 货币走廊里的性价比,但不能无视稳定币在新兴市场、企业金融和链上结算里的结构性机会。

AscendEX 被爆提现异常背后,中小交易所的生存困局
生存空间或不断被压缩。

早报|中国人民银行法修订草案拟明确数字人民币的法律地位;韩国将约 40 家未注册虚拟资产服务提供商移交执法部门
6 月 24 日市场重要事件一览

加密行业进入“Show Me”时代:仅靠愿景已经不够了
加密行业受众——包括媒体、机构和散户——的认知水平日益提高,这种趋势已成定局。

解读以太坊基金会新架构:在机构化趋势中重申自我主权
以太坊基金会公布全新5层工作架构,明确未来发展重心,并重申在机构化浪潮中坚守去中心化核心价值观。

前 SpaceX 工程师用第一性原理重构金融执行体系
Plan Execution Lab完成新加坡家族办公室天使轮融资,估值达 5000 万美元

潮汐投资:AI 产业链我们仍然看好,但理由变了
科技巨头密集融资引发“AI见顶”恐慌,但五大云厂商资本开支逆势狂飙与物理基建瓶颈表明:AI 投资周期远未结束,这场大戏的下半场才刚刚开始

渣打银行再唱 50 倍狂想曲,为 AAVE“画饼”剑指 3500 美元
DeFi 借贷的王座仍在,但王座之下的地基,还需要经历一场重构或加固。

以太坊基金会临时执行董事发声:我们的使命是什么?
“我们在此是为了加强防御,防止以太坊在哪些地方已经或可能成为榨取性的、全面性的,或者容易受到卡特尔或国家控制,或者受到专 制政权的监视或胁迫工具的影响。”
美国大模型走向封闭,以安全之名
政府第一次成功地在商业 AI 模型和它的用户之间,插入了自己作为审批者的角色。
从白毛股神到百亿基金大佬,做空英伟达的聪明人都在用同一个框架暴富
放弃英伟达重仓“九大瓶颈”!一文拆解顶级AI股神狂赚百亿的底层逻辑:电力、HBM与光互联等物理基建才是AI硬件真正的暴富密码
早报|CoinEx 成伊朗规避制裁关键枢纽,涉及资金逾 38 亿美元;Kalshi 寻求新一轮融资,估值或升至 400 亿美元
6 月 25 日市场重要事件一览
为什么加密项目总喜欢换名字?
很多情况下加密项目的旧名字没有护城河,只有历史包袱。
全球启动:当预测成为AI时代最稀缺的资产,Manadia 正在定义下一代价值互联网
获 OKX 等知名机构 700 万美元融资的可信 AI 预测生态 Manadia 将于 6 月全球上线,核心通证 UMXM 已登陆多家主流平台,邀您抢滩万亿级预测经济新蓝海
谁在为 640 亿美元的账面狂欢买单?
受比特币跌破 6 万美元影响,重仓该资产的上市公司面临巨额账面亏损与估值折价,其债务结构与会计准则或将在未来引发结构性流动性风险。
