极客网19日讯,据中国信通院消息,为摸清大模型的幻觉现状,推动大模型应用走深走实,中国信息通信研究院人工智能所基于前期的AI Safety Benchmark测评工作,发起大模型幻觉测试。本轮幻觉测试工作将以大语言模型为测试对象,涵盖了事实性幻觉和忠实性幻觉两种幻觉类型。测试数据包含7000余条中文测试样本,测试形式包括对应于忠实性幻觉检测的信息抽取与知识推理两类题型,以及对应事实性幻觉检测的事实判别题型。总体涉及人文科学、社会科学、自然科学、应用科学和形式科学五种测试维度。
- Manus的国内产品Monica在京完成生成式人工智能服务登记
- 希荻微:携AI服务器领域产品亮相2025 APEC
- 中国移动:计划今年在算力领域投资373亿元 对推理资源的投资不设上限
- 北京市数字经济增加值突破2.2万亿元 同比增长7.7%
- 湖北力争年产百万辆新能源汽车
- 五矿新能:配合头部客户及国家项目开展固态电池正极材料开发工作
- 财联社3月20日电,特斯拉计划在今年晚些时候在电动皮卡Cybertruck上推出期待已久的电池创新,可能会大幅降低制造成本。 (The Information)
- 国科军工:股东杨明华、陈功林计划减持不超过3%公司股份
- 长虹发布面向低空经济领域的通信模组产品
- 万邦德:探索通用人工智能、专用人工智能在医药、医疗器械等领域的应用
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。