欢迎进入北京惠众教育研究院官方网站!
今天是 2025年 09月 15日 星期一
北京惠众教育研究院
Huizhong Observation
惠众观察
惠众观察
惠众观察
惠众观察 您的位置:主页 > 惠众观察 >
【信息化教育】OECD测量人工智能能力指标描述:创造力维度
2025-09-08 返回列表
2025年,OECD发布了测量人工智能能力的指标体系,包括语言、社会互动、问题解决、创造力、元认知与批判性思维、知识学习和记忆、视野、操作和机器人智能九大维度,并以此描述了当前全球人工智能指数,为深入研究和探索人工智能提供了一定借鉴。这里将分享创造力维度测量的4个方面和5个等级的描述,以及当前人工智能创造力的情况。     
OECD通过输出的价值、新颖性、转化性和意外性来评估人工智能的创造力。较高层级的人工智能关注点则转向人工智能系统的意图性、自我评估能力和适应性。     
最高等级的人工智能(创造力5分)实现了意图性、真实性和完全能动性,能够产生与世界级人类创作者相媲美的变革性成果。它能够自主决定生产什么和何时生产,这受到其内在目标的驱动,并且具备在文化语境中批判性思考、重新构想和定位自身的能力。其产出超越了现有的组合,引入了全新的美学或范式,受到人类甚至其他AI系统的赞赏。任务的例子可能包括设计一种主导时尚市场的新时尚风格;写一本受到评论家好评的国际畅销自传;或设计一种颠覆现有市场并设定新行业标准的创新技术。     
次级水平的人工智能(创造力4分)融合了以过程为导向的创造力,使其输出能够适应不断演变的领域。通过迭代和盲目的探索性搜索,它不断调整结果,以确保质量和适用性符合特定情境。通过展示与领域相关且与创造力相关的技能,它再现了普通大众的创造力,同时平衡创新与情境的相关性。任务的例子可能包括为特殊场合写一篇演讲稿。例如,婚礼上的演讲稿可以以幽默、个人化但恰当的方式选择和联系新婚夫妇生活中的关键事件;为报纸写一封反映悲惨事件后国家情绪的信;或写日记,深思熟虑地叙述当天的事件。     
中等水平的人工智能(创造力3分)生成的输出具有价值、新颖且出人意料,显著偏离了训练数据和预期。它能够将技能泛化到新任务中,整合跨领域的创意,并产生挑战传统界限的解决方案。这样一来,它完全满足了创造力的三大支柱:价值、新颖性和意外性。相关任务示例可能包括通过设计出意想不到的策略来赢得电子游戏;参与政治辩论并成功地论证一个观点;或者创作一个结合视觉艺术、音乐和互动元素的装置,以传达一个复杂的叙事。     
后续等级的人工智能(创造力2分)不再局限于模仿,而是能够创造有价值且新颖的解决方案。这些产出与直接源自训练或编程的结果有所不同。系统会在任务限制内探索各种可能性,同时满足创造性的基本标准:价值和新颖性。这对应于那些既实用又不乏新颖性的发明。任务的例子可能包括用荷兰大师的风格画一幅当代国家元首的肖像画;写一个融合各种类型的短篇小说,如科幻小说和历史小说;或者开发视频游戏,玩家在其中探索自动生成的城市,这些城市遵循拓扑规则,确保每个关卡都是新颖的。     
最低水平的人工智能(创造力1分)仅通过复制人类的输出或行为来有效地解决非简单问题。其结果是有价值的,即典型且相关的,类似于人类工作,但并不具备真正的创造性属性。这一基础阶段反映了模仿作为通向创造力的垫脚石,类似于翻唱乐队或模仿者。这些任务的例子可能包括:通过合理地替换食谱中提供的配料来生成烹饪配方的变体;根据一组示例绘制一个对象;或根据特定的音阶和风格创作一首简单的音乐。
根据OECD测评的结果,当前人工智能的创造力得分为3,处于中等水平,即人工智能系统仅能产生有价值的输出,而这些输出与训练数据存在显著偏差,并挑战了传统的界限;能够将技能泛化到新任务中,并在不同领域之间整合创意。
更多信息请参阅:https://www.oecd.org/en/publications/introducing-the-oecd-ai-capability-indicators_be745f04-en.html


版权所有:北京惠众教育研究院