ChatGPT大语言模型中文写作能力评价研究初探
祝南星 周逸凡 王正印 高家红 李庆莲
南昌大学第二临床医学院 湖南师范大学 长沙市第一中学 长沙市周南中学 湖南株洲市南方中学
随着人工智能在教育领域的应用日益增多,特别是在以ChatGPT为代表的大模型时代,研究者不断关注人工智能在中文写作中的能力和表现。尽管普遍认为人工智能的语言处理能力不及人类,但这一观点缺乏实证支持。为此,本研究选取人工智能生成的作文与人类学生作文作为样本,邀请具有丰富高考阅卷经验的语文教师进行三轮评判,评估ChatGPT的中文写作能力,并测试人类专家识别人工智能作文的能力。结果表明,ChatGPT的中文写作水平相当于人类学生中等偏上的水平,在内容和表达上与人类学生无显著差异,但发展评分略低于人类学生。同时,人工智能文本识别软件的准确率达到0.88,显著高于人类专家的识别能力。研究结果表明,正确引导ChatGPT等人工智能工具在语文教学中的应用,有助于提升教学效率和学生的学习兴趣。