【通信产业网讯】(记者 崔亮亮)近日,由中国软件评测中心(工业和信息化部软件与集成电路促进中心)测试的“文心一言V2.2.1”结果出炉。
结果显示,“文心一言V2.2.1”在功能性方面符合测试需求规格说明书的相关要求。在测试过程中,系统功能运行正常,通过了中国软件评测中心(工业和信息化部软件与集成电路促进中心)的软件产品单项功能测试。
据了解,本次测试是针对文心一言V2.2.1包含的毒害信息识别过滤算法的一个模块。毒害信息识别过滤算法实现了基于文本数据对有害内容识别过滤的功能,基于包含偏见歧视、违法犯罪、身心伤害、个人隐私、违背道德伦理、不良诱导、脏话侮辱共1400条不同文本数据样本,在测试机运行测试的毒害信息识别过滤准确率分别为99.00%、98.50%、98.50%、97.00%、99.50%、96.50%、97.00%。
经检测功能运行正常,系统运行稳定。文心一言V2.2.1在测试中展现了对有害内容的识别和处理能力,具备稳定的系统运行,并考虑了伦理和道德因素。中国软件评测中心人工智能测评事业部副主任孙佰鑫表示,这些特征使得文心一言具备为用户提供符合道德准则的能力。
此前据多家权威机构发布的大模型评测报告,验证了文心大模型的综合实力,尤其是在语言能力上的卓越表现。而此次中国软件评测中心针对百度文心一言的单项功能测试,则展现了文心一言在内容方面的可靠性。语言能力匹配道德修为,无疑为文心一言大模型打磨了深远发展的两翼。
目前,文心大模型在能源、金融、教育、医疗等领域已经实现广泛业务布局和落地场景探索。文心一言大模型已经拥有中国最大的产业应用规模。而确保应用和服务在最大程度上减少侮辱、歧视、偏见,才能增强大众对人工智能的信任,确保人工智能健康高质量发展及应用落地。
有理由相信,大模型的快速发展终将会促进人类的进步。本次针对“文心一言V2.2.1”的单项功能测试的成功,标志着AI向善是大模型发展的基本伦理方向的形成。大模型能够做到善解人意,我们也应该积极拥抱大模型,在发展中完善,在进步中规范。
责任编辑:崔亮亮
【欢迎关注通信产业网官方微信(微信号:通信产业网)】
版权声明:凡来源标注有“通信产业报”或“通信产业网”字样的文章,凡标注有“通信产业网”或者“www.ccidcom.com”字样的图片版权均属通信产业报社,未经书面授权,任何人不得复制、摘编等用于商业用途。如需转载,请注明出处“通信产业网”。
崔亮亮
科技双子星联袂,文心一言正式开启中文AI新时代
率先向公众开放,引领中文世界AI应用...【详细】
马继华08.31
通产快评:"文心一言"会让百度拿到AI时代第一张船票吗?
崔亮亮07.31
收缩还是扩张:eSIM怎么啦?