品玩8月1日讯,据谷歌官方消息,宣布推出 Gemma Scope,这是一套帮助研究人员了解 Gemma 2内部工作原理的新工具。
Gemma Scope 集合了数百个免费开放的稀疏自动编码器 (SAE),适用于 Gemma 2 9B 和 Gemma 2 2B。谷歌还对 Mishax 进行了开源,Mishax 是我们开发的一款工具,它支持 Gemma Scope 背后的大部分可解释性工作。
谷歌希望Gemma Scope 的发布能促成更多雄心勃勃的可解释性研究。进一步的研究有可能帮助该领域建立更强大的系统,开发更好的防护措施来防止模型幻觉,并防范来自自主人工智能代理的风险,如欺骗或操纵。
0 条评论
请「登录」后评论