王雯、李永智:国际生成式人工智能教育应用与省思

时间:2024-06-17 来源:《开放教育研究》 浏览量:1721 【 浏览字体:

 

摘要:生成式人工智能日益成为未来教育变革的最大变量。调研发现,当前生成式人工智能在教育政策、学术研究、行业发展和教育实践应用等维度发生转向。各国政府、相关组织相继出台政策,全球很多院校从禁止生成式人工智能逐步转向指导性应用;国内外学界日益关注生成式人工智能对教育的影响和潜在风险;市场应用在教育类型、学科覆盖等方面呈现多元化的发展趋势。长远来看,生成式人工智能将推动现有产业组织形态、用工模式、用工理念发生根本性变化,进而重构人才培养目标、重塑教育形态、赋能科学评价。生成式人工智能的“生成幻觉”问题,潜在的意识形态和伦理风险,师生之间的信任危机,以及对教育公平的新挑战不容忽视。我国应以提高师生人工智能素养作为应用前提,以跨学科、有组织的国产研发破解应用难点,以更严格的政策约束确保应用安全。同时,为避免造成新的数字鸿沟与教育不公平,应建立统一研发标准,降低应用成本,通过接入国家智慧教育平台,最终实现全体师生共享普惠优质的生成式人工智能教育应用带来的发展红利。

关键词:生成式人工智能;教育数字化;国际趋势

2022年11月,OpenAI推出ChatGPT,将自然语言的理解与生成能力提升到新的高度,具备了跨学科、多场景、多用途的通用性,引起社会广泛关注(戴琼海,2023)。一年多来,生成式人工智能技术快速迭代。OpenAI持续推出GPT-4、GPT-4Turbo,在输入长度、数据质量、图像处理和文本到语音转换等方面不断超越;谷歌发布大模型Gemini,其Ultra版本首次实现大模型在“大规模多任务语言理解”领域超越人类专家;Anthropic发布Claude3系列模型,在推理、数学、编码、多语言理解和视觉方面确立了新的行业基准。我国也相继出现了百度文心一言、讯飞星火、阿里通义千问、清华智谱等大语言模型。同时,生成式人工智能正朝着多语言的理解与生成能力提升到新的高度,具备了跨学科、多场景、多用途的通用性,引起社会广泛关注(戴琼海,2023)。一年多来,生成式人工智能技术快速迭代。OpenAI持续推出GPT-4、GPT-4Turbo,在输入长度、数据质量、图像处理和文本到语音转换等方面不断超越;谷歌发布大模型Gemini,其Ultra版本首次实现大模型在“大规模多任务语言理解”领域超越人类专家;Anthropic发布Claude3系列模型,在推理、数学、编码、多语言理解和视觉方面确立了新的行业基准。我国也相继出现了百度文心一言、讯飞星火、阿里通义千问、清华智谱等大语言模型。同时,生成式人工智能正朝着多模态方向发展,出现了诸如MidJourney等图像大模型、Sora等文生视频大模型。2024年5月,OpenAI发布可以跨文本、音频和视频等所有模态进行实时推理的全能模型GPT-4o,向更自然的人机交互迈出重要一步。据不完全统计,中国已发布79个10亿参数规模以上的大模型,全球范围内10亿以上参数大语言模型总数已达200多个,且数量和质量仍在不断增长。此外,生成式人工智能已在一些专门领域取得重要进展,如生物学领域关于蛋白和生命结构预测的模型AlphaFold3,被认为不仅有望革新生物学研究,更将为药物发现带来前所未有的推动力(Callaway,2024)。

生成式人工智能在诸多任务中表现出与人类相当的心智水平(Hagendorff et al.,2023),被预言“会改变教育”(Thorp,2023)。在教育领域,自ChatGPT发布后,生成式人工智能的相关讨论、研究、行动、应用层出不穷,已成为未来教育改革发展的最大变量。本研究从政策、研究、研发与应用等多维度审视,为利用生成式人工智能推动我国教育数字化纵深发展提供理论支撑和现实关照。

一、现实转向

(一)政策转向

1.全球学校从禁止逐步转向指导性应用

2022年11月ChatGPT发布后,美国纽约和西雅图教育系统、法国巴黎商学院、牛津大学、剑桥大学、曼彻斯特大学、布里斯托大学和爱丁堡大学等,都曾出台规定禁止学生使用ChatGPT。但2023年7月以来,许多国家和学校已从禁止使用生成式人工智能转变为允许和鼓励使用。美国密歇根大学购买了GPT-4、GPT-4Turbo、LIama2等大模型服务,构建了UM-GPT(University of Michigan,2023),供全校师生免费使用。哈佛大学在ChatGPT基础上研发CS50Bot,作为该校热门课程CS50的虚拟教师(Liu et al.,2024)。一些公立中小学也在尝试将人工智能融入课堂。例如,加利福尼亚州一些小学已将生成式人工智能作为教学辅助工具,用于提高学生学习效率。在欧洲,由牛津大学、剑桥大学、伯明翰大学等24所英国顶尖高校组成的罗素大学集团联合发布了在校园使用生成式人工智能工具的全新原则。只要“以合乎道德和负责任的方式”,学生可以使用ChatGPT等人工智能工具完成作业和规划评估(The Russell Group,2023)。荷兰代尔夫特理工大学尝试将生成式人工智能辅助教学技术应用于课堂,提高学生的参与度和教学质量。澳大利亚教育部宣布从2024年起允许包括ChatGPT在内的人工智能技术在所有学校使用(The Guardian,2023)。我国生成式人工智能教育应用迈入探索阶段。香港科技大学在ChatGPT3.5版基础上推出HKUST ChatGPT(The Hongkong University of Science and Technology 2023,),为全校师生提供安全可用的生成式人工智能服务。清华大学2024年在全校范围内开设100门“人工智能赋能教学试点课程”,推动大模型技术与课程不断融合。利用生成式人工智能技术推动课堂教学改革已然成为全球各类院校的共识。

2.政府和组织出台政策鼓励试点应用

生成式人工智能已成为全球各国教育数字化转型的重要方向。2023年,美国教育部发布《人工智能与教学的未来》(U.S.Department of Education,2023),提出人工智能为解决教育政策优先事项带来重要机遇,阐述了制定人工智能政策的明确需求。英国教育部发布《生成式人工智能在教育中的应用》(U.K.Department for Education,2023),阐明了生成式人工智能教育应用的立场,强调妥善使用的积极作用。日本发布《初等中等教育阶段应用生成式人工智能的暂行指南》(文部科学省初等中等教育局,2023),建议学校小范围尝试使用生成式人工智能,并注意验证其应用效果。澳大利亚发布《澳大利亚学校生成式人工智能框架草案》(Australian Government Department of Education,2023),鼓励学校工作人员、教师和学生“安全且合乎道德”地使用生成式人工智能。我国国家网信办等七部门联合公布《生成式人工智能服务管理暂行办法》(国家网信办等,2023),鼓励生成式人工智能技术在各行业、各领域的创新应用。联合国教科文组织发布《生成式人工智能教育与研究应用指南》(UNESCO,2023),呼吁各国政府通过制定法规、培训教师等,规范生成式人工智能的教育应用。这些政策的发布,显示了在政策限度内有序开放生成式人工智能教育应用是必然趋势。

(二)研究转向

1.研究数量迅速增加

本研究以“生成式人工智能”“Generative Artificial Intelligence”“ChatGPT”“GPT”“GAI”“AIGC”等作为关键词,时间限为2022年11月30日至2024年1月28日,主题检索发现中国知网共收录文献4236篇,其中教育学科文献638篇,占15.06%;Web of Science数据库共收录文献5002篇,其中教育学科文献918篇,占18.35%。由此可见,研究者对它的关注度之高、研究数量之巨。

2.普遍关注教育影响和潜在风险

从教育领域的研究主题看,国内学者较多关注生成式人工智能特别是ChatGPT的教育影响,尤其关注它给教育带来的挑战和风险,并尝试提出应用策略和应对路径。从教育类型看,高等教育是重点研究对象;从教育主体看,教师得到更多关注;从学科看,体育学科的研究丰富(见表1)。国际研究与国内研究的焦点和关注点基本一致,多围绕ChatGPT为代表的生成式人工智能在教育领域的表现(performance)开展评估(assessment/examination)研究,重点关注它给未来教育带来的潜在问题和挑战。从教育类型看,高等教育也是国际研究的重点;从教育主体看,与国内研究关注教师不同,国际研究更多关注学生;学科领域则更关注医学教育。国际研究的鲜明特色是,高度关注技术层面,即大语言模型(见表2)。

(三)市场转向

2023年上半年以来,世界各国教育科技企业积极将生成式人工智能大模型接入教育产品,加大研发和落地应用。美国生成式人工智能教育产品井喷式涌现(见表3),覆盖中小学、大学和继续教育等类型,涵盖语言学习、学科教学、测试备考、学位与技能提升等应用场景。其他国家的教育科技公司也加快研发进度(见表4)。韩国面向SAT、ACT等类型考试,新加坡、波兰、约旦面向中小学STEAM等学科教学,印度面向编程教育,加拿大面向企业培训,开发了生成式人工智能应用工具,以实现个性化教育。我国生成式人工智能教育产品落地加快(见表5)。基于星火大模型、通义千问等通用大模型的部分教育产品落地应用,部分教育科技公司也开发了教育垂类大模型并衍生了相关产品,浙江大学、北京语言大学等高校也加入大模型教育应用研发赛道。生成式人工智能的教育应用已趋于成熟,并在教育类型、学科覆盖等方面呈现多元化发展趋势。

二、教育影响

(一)生成式人工智能成为推进教育改革的最大变量

国家政策、学术研究、市场研发和学校实践都将生成式人工智能作为未来教育发展的重要力量,其缘由是生成式人工智能具有强大的情景学习、思维链推理和多轮对话等能力(桑基韬等,2023),可以在教育各个方面发挥颠覆性影响,塑造更为高效、公平、个性化的教学生态。

1.重构人才培养目标

生成式人工智能技术的发展,将推动现有产业组织形态、用工模式、用工理念发生根本性变化。一方面,由低技能劳动力胜任的劳动分工职位,将越来越多让渡于人工智能;另一方面,传统认知中的高技能行业,如记者、作家等文本创作类职业,程序师、软件工程师等代码编写类职业,设计师、剪辑师等多媒体创造类职业等,将因生成式人工智能对文本、图像、音视频等的突破性发展,迎来巨大挑战和替代风险。生成式人工智技术发展也将推动人工智能训练师、数据科学家等新职业的出现(李永智,2024)。同时,知识更新和创生的速度将远高于工业社会,未来职业将不断更迭,即使学生真的将所有时间用于学习,也无法学完未来从事职业所需的所有知识。学生将不再像工业社会那样,为未来储备全部可能用到的知识而学习,人才培养目标将转向人工智能无法替代的高阶认知、计算思维、理性精神、创新能力和终身学习能力。

2.重塑教育形态

随着生成式人工智能在教学过程中的深度应用,学校教育样态也将突破班级、年级、学科、时空限制。生成式人工智能为师生关系增添复杂性(Jess,2024),“师—机—生”的三元教学结构将取代现有的“师—生”二元结构。家长和社会将不像原来那样远离学生,而是全面介入和融入学生的成长过程(李永智等,2024)。

教师与人工智能共存、共教、共学,将成为数字时代教师角色嬗变的必然选择。一方面,数字时代信息源过载会导致教师面对大数据时感到“乏力”,教师缺乏足够的能力和精力处理信息,而生成式人工智能基于海量数据训练,汇集丰富的学科知识和策略性知识,可以弥补个体教师认知或经验的不足,进而替代教师完成部分教学工作,提升教学质量和教学效率。但是,人类教师独有的教学经验与个人智慧,在学生情感塑造和情绪支撑上的独特优势,仍具有核心价值。生成式人工智能与教师的替代关系反映为“补位式替代”,而不是“挤出式替代”(李英福等,2019)。人类教师智慧与机器智能完美对接,生成人机共为教学主体的人机复合教师(邓友超,2023),推动教师教学整体水平“底部抬升”,减少因教师水平参差不齐造成的教育不公平,这是未来教师队伍建设的重要方向。

“流水线”式的人才培养模式,将被“大规模的因材施教”所取代(李永智等,2024)。学生将从被动接受学习,真正转型为学习的主体,在生成式人工智能引导下主动开展自我学习。通过向生成式人工智能大模型提供有关角色特征和偏好的额外信息,大模型可以生成更多个性化的、有吸引力的回应,实现学习模式从“千人一面”到“千人千面”(白雪梅等,2024)。例如,针对学生个性化学习需求和学习风格,生成个性化学习计划,这样不仅可以提高学习效率,还可减轻课业负担。同时,泛领域开放式知识问答是生成式人工智能技术的突出能力,它利用生成式人工智能大模型开展学生一对一辅导,可以降低学生自主学习的孤独感,提高学生学习兴趣,赋能个性化学习。

3.赋能科学化评价

生成式人工智能技术可以通过信息跟踪挖掘、数字回溯分析、科学监测评价等,描绘学生成长轨迹,完整记录学生的学习过程。教学评价将从结果分数驱动走向过程数据驱动(李永智,2023),提升教学评价的科学性和精准度,实现因材施教。教师也可以通过生成式人工智能大模型实时获取学生学习过程数据,帮助学生巩固薄弱知识点,提高学习质量。与此同时,生成式人工智能也可以为教师提供全面而客观的评价报告,提供针对未来教学改进的有益建议。

(二)潜在风险

教育不仅仅承担着知识传授的责任,同时也承担着培养学生主体意识、塑造学生价值观和健全学生人格的重任。因此,生成式人工智能的教育应用,无疑需要前瞻其潜在的风险。

“生成幻觉”问题可能误导学生认知,导致思维惰化。一方面,生成式人工智能训练所依赖的数据集可能包含过时或错误的信息,因此它可能给出错误答案;同时,生成式人工智能技术具有超强的模拟人类思维能力,能产生足以以假乱真的信息,进而误导学生。另一方面,平台推荐个性化学习内容的过程中,如果采用未经验证的算法,有可能导致信息不对等。如果学生盲目信任机器给出的答案,缺乏对知识的基本认知判断,长期以往,就可能建构起错误的知识体系和认知结构,后果不堪设想。而过度使用生成式人工智能解答问题或辅助学习,易使学生失去独立思考能力,可能导致他们的思维陷入依赖状态,影响其批判性思维和创新能力的发展,甚至引发学术不端等不良行为。

因此,学生价值观和意识形态塑造面临挑战,潜在的伦理风险不容忽视。生成式人工智能的决策过程普遍缺乏透明性,一旦系统内嵌了开发者的主观价值观,或者受到带有偏见的训练数据的影响,生成式人工智能大模型可能输出与我国社会主义核心价值观不相符的特定意识形态和特定价值导向的内容,从而给学生带来负面影响。教师与学生使用生成式人工智能的同时,其使用数据(包括输入数据、反馈数据等)本身也会被生成式人工智能记录下来,如果没有采取充分的措施保护隐私,这些师生数据也可能被误用或盗用。

学生和教师之间也会面临“信任侵蚀”(Fowler,2023)。生成式人工智能技术的突破大大降低了学生作弊所需的成本和努力(Lodge et al.,2023)。Turnitin的报告显示,每10篇大学生论文就有一篇部分是人工智能写的(Williams2023)。学生利用生成式人工智能撰写的作业甚至完成度更高,教师难以辨别,容易引发教师对学生尤其是往期学业表现不佳学生的认识偏见。另一方面,学生可以轻松通过生成式人工智能大模型获取更广泛且深入的知识,部分答案甚至优于教师的见解,造成学生对教师专业能力的质疑,进而降低跟随教师学习的兴趣,最终造成学业水平降低。

此外,虽然生成式人工智能可以提供个性化教育,但如果不能普及到所有学生,反而会加剧教育不公平。生成式人工智能大模型的应用成本往往较高,如部署、推理、维护等都需较多的投入。不同地区的财政支撑能力不同,如果仅有经济发达地区有条件和能力使用大模型推动教育变革,则可能引发新的数字鸿沟,造成新的教育公平问题。

三、省思与建议

科技进步是社会变革的动力源泉,也是推动教育变革的关键力量(李永智等,2023)。国内高校的调查研究显示,五分之一大学生表示会经常使用生成式人工智能,七成大学生表示会偶尔使用(李艳等,2024)。生成式人工智能的教育应用势不可挡,只有理解和积极应对才能充分利用技术进步带来的红利,这需要从理念到行动的全面转变。

(一)以提高师生人工智能素养作为大模型教育应用的前提

生成式人工智能的教育应用,对师生素养提出更高要求。所有师生对接触和使用生成式人工智能都应有充分的认知准备,准确认识教育大模型的研发目标和应用出发点,即为赋能师生而不是替代师生。师生应强化教育主体意识,从工具视角准确认识生成式人工智能,学会在保护自我隐私、遵守伦理规范、批判性认识大模型输出信息的前提下,规范、适宜地享受个性化和高效的教与学服务,具有与人工智能协同学习和工作的人工智能素养,成为适应人工智能时代的未来人才。美国俄亥俄州开发了人工智能工具包,为该州学校所有利益相关者(地区负责人、学校校长、教育工作者、家长等)提供可用资源,指导他们制定具体政策,开展实践,确保学校安全、有效和负责任地集成人工智能应用,引导学生做好新兴技术的使用准备,提升学生人工智能素养(Innovateohio,2023)。生成式人工智能应用如火如荼,我国应加快制定操作性指南,制作应用案例手册,加强宣传和培训,帮助师生做好生成式人工智能应用的认知和行动准备。

(二)以跨学科、有组织的国产研发破解教育场景应用难点

真正基于国产生成式人工智能大模型研发教育应用,才能保证算法和数据的安全可控,保证学生受社会主义核心价值观的正确引导,不出现意识形态偏见,同时保证关键数据的安全可控。此外,无序的市场开发与应用会带来诸多问题,这需要推动教育、科技部门、机构和相关企业形成研发合力。从可持续发展的角度看,政企联合攻关,可以最快突破技术瓶颈,避免多头为战的资源浪费,实现从技术到硬件的全部国产自主可控,突破“卡脖子”困境。从教育发展的角度看,教育机构的介入,有助于真正构建高质量的教育语料库,研发出符合教育规律、满足教育需求的应用系统,最大化实现教育资源的优质均衡。当前国内外教育领域生成式人工智能研究数量虽多,但相对割裂。教育研究者多从教育规律和教育发展的角度探讨技术应用的可能与风险,技术研究者则更多关注通用生成式人工智能大模型,缺乏对教育领域大模型的深入探究。生成式人工智能要真正变成变革教育的大引擎,需要人工智能专家和教育专家共同开展跨学科合作研究。特定学科专用生成式人工智能大模型,还需要将学科专家纳入研究团队。只有跨学科研究才能让生成式人工智能真正发挥技术优势,“说出”教育行话,产生预期的教育效果。

(三)以更严格的政策约束确保教育大模型的应用安全

生成式人工智能的数据安全和伦理风险是国内外教育政策和研究的关注重点。例如,欧盟专门制定了针对教育工作者的人工智能道德准则,规范教育工作者的行为(European Commission,2021),美国电气和电子工程师协会(Institute of Electrical and Electronics Engineers,IEEE)发布了《价值对齐设计》(Ethically Aligned Design)(IEEE,2022),推进人工智能的伦理设计。由于生成式人工智能大模型的训练与应用涉及很多敏感数据,因此面向教育领域特别是基础教育领域的应用,教育部门需要在《生成式人工智能服务管理暂行办法》等已有政策基础上,建立更完备更严格的教育应用人工智能管理制度,以确保其开发和使用符合严格的数据安全和隐私保护标准;明确要求加强教育大模型的价值观嵌入与强化训练,以服务于社会主义核心价值观和伦理原则;限制生成式人工智能在特定教学场景的使用,通过设立严格的操控标准和追溯机制,对使用行为和结果进行系统标记等,避免对学生产生负面影响。

(四)以全体师生共享技术发展红利作为教育大模型应用目标

“确保人工智能技术使尽可能多的人受益和赋能”是人工智能设计和使用的第一原则(PIA,2016)。英国《国家AI战略》提出有必要扩大人工智能相关能力在社会所有阶层的分布。为满足这一需求,英国政府倡导利用教育部的技能训练营,提供与人工智能相关的技能培训;为避免标准的多样性阻碍人工智能应用发展,建立人工智能标准中心,以该中心协调各行政单位人工智能的标准制定计划(HM government,2021)。纵览我国教育政策,教育公平的理念贯穿始终。以生成式人工智能推动我国教育发展也应有助于实现公平且有质量的教育。为实现全体师生共享普惠优质的生成式人工智能教育应用带来的发展红利,我国的生成式人工智能教育应用与研发应建立全国统一的标准体系;保证参数规模控制在适当范围内,寻求研发投入和应用成本与大模型应用成效的平衡,避免高成本造成新的数字鸿沟与教育不公平;为避免重复建设和资源浪费,可将教育大模型的能力接入国家智慧教育平台等教育公共服务平台,同时实现国家平台智能化升级。

来源|《开放教育研究》2024年第3期

作者|王雯(全国教育科学规划办公室助理研究员)、李永智(中国教育科学研究院党委书记、院长、研究员)