您现在的位置是:网站首页>诗词理论诗词理论
郭友琴:AI写诗的能力水平比较和发展趋势
郭友琴2025-03-131073人已围观
简介郭友琴,号林间流水。洛阳人,理工男,教授级高级工程师,一级注册建造师,诗词爱好者。现为中华诗词学会诗教部副主任,河南诗词学会常务副会长,中华诗词高研班导师。
郭友琴:AI写诗的能力水平比较和发展趋势
来源:中华诗词学会
郭友琴,号林间流水。洛阳人,理工男,教授级高级工程师,一级注册建造师,诗词爱好者。现为中华诗词学会诗教部副主任,河南诗词学会常务副会长,中华诗词高研班导师。
乙巳新正前夕,DeepSeek从天而降,顿时成了春节期间诗词圈最受欢迎的一款AI应用。诗人以及广大诗词爱好者觉得眼前突然从天上掉下个林妹妹,引得微信上一片欢腾,大都沉浸在一种莫名的兴奋中。有用它体验作诗的,有用它对自己的诗作进行点评的,有为AI智能技术突飞猛进赞颂的,当然也有种种担忧的。其实DeepSeek作诗并不是个新鲜事物,之前已经有许多人在使用AI写作工具,也出现了一些较为著名的AI写诗程序或模型。如豆包、Kimi、AI万能写作、万能AI盒子、百度AI+,等等。只不过他们一直都在研发,在默默地积蓄力量优化技能,没有像DeepSeek那样横空出世举世震惊而已。
目前AI写诗模型的技术特点是通过无监督学习捕捉语言深层结构,生成形式与内容上与人类一般水平接近的诗词和评论。本文试图通过对AI写诗模型成长过程的回顾,AI写诗的特点、不同AI写诗能力水平的测试、与诗人写诗的区别和不足等进行梳理和比较,进而加深诗词爱好者对AI写诗的认识和理解。AI评诗将另文进行讨论。
一、AI写诗评诗模型成长过程的简要回顾
“AI写诗”近年来已经成为一个普遍讨论的现象,也引发了更多的关注和实验。在高校及一些研究机构,不少诗词写作AI模型被研发和训练出来,用以诗学研究。根据笔者平时注意到的资料,将AI写诗模型的成长过程做一简要回顾。
AI写诗是人工智能在自然语言生成(NLG)领域的重要分支,其发展历程与技术进步密不可分。从早期探索(1950-1980,规则与随机性的碰撞)的规则驱动到统计与机器学习时代(1990-2010,从概率到初步理解),再到如今的深度学习模型(2012至今,生成模型的爆发),经历了多次规范式转变。
上个世纪80年代始,就有不少个人和研究机构陆续开展了汉语诗歌的自动创作研究。到网络完全贯穿生活的时候,已经诞生了大批写诗软件。如稻香老农作诗机、猎户星免费诗歌自动制作机、计算机诗人、古典诗词撰写器、诗歌生成器、诗词快车、WAP asp自动写诗 PC版、韵脚大全、在线藏头诗在线生成器等各式版本的“写诗软件”。其中上世纪90年代,由厦门的林鸿程先生独立开发的“稻香老农作诗机”一直在不断的升级和完善中。2001年,林先生首创“稻香居电脑作诗机”,至2018年,已被网友使用超过1亿次。
2017年,Transformer架构的提出(Vaswani et al.)彻底改变了NLG领域。基于注意力机制的模型(如GPT-2、GPT-3)在诗歌生成中展现出惊人的流畅性和创意性。当年中文诗歌模型生成:清华大学团队推出自动诗歌生成系统“九歌”,利用古典诗词语料库,生成符合平仄、对仗的格律诗。至今已累计为用户创作超过400万首诗词。
2017年12月15日,在中央电视台的《机智过人》综艺节目中,清华机器人“九歌”与清华才女PK作诗。结果表明:机器人作诗的表现打动了观众。但是无论从技术上还是直观的感受上,机器人创作的都只是诗的表层,离真正好的诗作、离人类的情感相去甚远。当时,笔者曾以《电脑作诗机》为题写诗纪录当时的观感。诗中写道:“屏内乾坤大,芯中意象纷。回车耽妙句,击键创雄文。思索高科技,词源阿里云。真情何处有,机智正殷殷。”笔者认为作诗是一个主观和创造的过程,需要有诗人的真实情感,机器人正在为达到人类诗人的水平和感性表达不断努力。
近年来,多个配置有自动作诗评诗功能的AI App逐一出现在大众视野中,但未能引起世人的过多关注。2025年元月26日,中国AI大模型创业公司DeepSeek(深度求索)正式发布DeepSeek-R1大模型引起轰动,提高了广大诗词爱好者对其它具有写诗评诗功能的AI模型的关注度。
二、AI诗词写作的特点
AI写诗是利用知识库的储存能力,通过自然语言处理等高度自动化的技术系统显著提高写作效率,使得神经网络模型在诗词创意设计中进行新的组合和发掘,并根据用户选择的风格或主题,自动生成的、符合要求的诗词。
AI凭借强大的算法和海量的数据储备,能生成“陌生化”的意象组合,能够在短时间内生成大量风格各异、主题多样的诗词作品。这些作品往往蕴含着独特的语言组合和表达方式,打破了传统诗词创作的固有模式和思维定式,同样在主题挖掘方面,AI可以从巨量的信息中筛选出各种各样的主题,无论是对宇宙奥秘的探索,还是对日常生活细节的关注,抑或是对社会热点问题的思考,能为当代诗人提供丰富的灵感,生成与之相关的诗词作品。这使得诗人能够接触到更广泛的创作题材,进而拓宽自己的创作视野,从新的维度去创作出更具深度和创新性的作品,快速形成自己的诗词创作风格。
三、不同AI写诗能力水平的测试
DeepSeek的爆火,引起了人们对AI写诗的极大关注,并成了当前的热点话题。诗人会被AI代替吗?以后还需要诗人吗?还需要再写诗吗?这些问题给诗人和诗词爱好者带来了很多困惑与冲击。要回答这些这些问题,我们先要检测一下当前AI模型的诗词创作能力和水平。在微信朋友圈和各种诗词公众号上,有关对DeepSeek写诗的赞扬和吐槽随处可见。在此我选取两个内容,挑选Kimi、豆包、DeepSeek R1和百度AI+四种常用AI模型进行两轮测试,对它们的作诗能力水平进行比较。
第一轮测试,要求4个AI模型以《思乡》为题写一首七律,重点测试AI写诗对表达技巧的运用,和是否能表达出客居他乡的游子思乡思亲的情境。不到一秒钟,四个AI都提交了答卷。
Kimi:思乡
月挂疏桐夜色凉,独倚危楼望故乡。
千里烟波迷远树,一怀愁绪锁斜阳。
梦中常忆儿时路,耳畔犹闻故里香。
何日归帆风正顺,重逢把酒话沧桑。
简评:Kimi这首诗首联以“疏桐”意象含蓄地点名了思念家乡,独倚危楼相望的时间是秋天。“自古逢秋悲寂寥”,接着中两联由望生感,由感入忆,虚实相映,视觉听觉并用。最后以盼归“把酒论沧桑”作结,较好地表达了思乡的题旨和游子盼望回乡的心情。可酌之处一是“故乡”“故里”重复,二是“风正顺”是现在进行时,与“何日”相悖。
豆包:岁暮思归
寒星数点照霜天,岁末愁思绕客船。
异地风摇残叶瘦,故园月满旧篱前。
遥思慈母添衣暖,每念严亲问讯绵。
望断归程心欲碎,凭栏独倚盼团圆。
简评:豆包这首诗没有按照所出测试题目《思乡》写,而是另取诗题为《岁暮思归》描写漂泊异乡的游子在岁末思乡心切的情态。首联点明时间是月明之夜,霜天寒星营造清冷氛围。颔联寓情于景,由近及远,异地残叶与故园满月形成对比。颈联递进,凸显对家乡的思念,对父母的牵挂。最后以盼团圆直抒胸臆,表达渴盼归家与家人团圆的迫切心情。可酌之处是颈联有合掌之弊;题为“岁暮思归”.诗中又出现“岁末”嫌累赘且浪费有限空间。
Deep Seek R1:思乡
秋风飒飒雨潇潇,落叶纷飞满地飘。
故土千山千里远,异乡人事几多遥。
愁肠百结难消解,泪眼朦胧易寂寥。
归梦频惊何处是,思乡情切夜迢迢。
简评:Deep Seek R1这首《思乡诗》首联目近,寓情于景,点明时间和风雨萧索的气象和环境。颔联生概,含蓄道出远离故土,落魄异乡的无奈。境联叹叙,状人在异乡伤感落寞情景。尾联著题,表达思乡情切、归梦惊枕、长夜难眠的况味。可酌之处一是后三联多用情语展叙,缺少对故乡风物人情的描写。二是千山/人事、百结/朦胧对仗欠工,且“朦胧”应为“蒙眬”之误。
百度AI+:思乡
思乡情切泪沾衣,远望家山入梦迷。
云外飞鸿传尺素,风中落叶寄相思。
月明空照孤窗冷,夜寂难眠独坐痴。
归意萦怀何处诉,唯将心事付诗词。
简评:首联破题生发思情。颔联承“远望”寓情于景,“飞鸿传尺素”和“落叶寄相思”两个意象巧妙地将自然景象和人的情感结合在一起,展现对家乡亲人的眷恋和思念。颈联转写室外内情景,窗前“月明”“孤窗”“夜寂”“独坐”,营造出一种清冷孤寂的氛围,反映了诗人月夜孤独的内心感受。尾联设问引发读者思考,突出归意萦怀无处倾诉,只能选择诗词作为抒发的无奈,给人以含蓄蕴藉之感,表达了对故乡的思念,对现状的不满,对未来的不满的惆怅情感。
思乡古诗词以其情感真挚、意境深远、语言生动的特点,诗中常常融入自然景物的描写,以及运用寓情于景、情景交融的表现手法打动读者的心灵,使人们能够对家乡、亲人有更深的思考和感悟。第一轮测试出题后四个AI模型均在一秒钟内给出答案,在能快速生成诗词作品方面能力相当;在格律和章法上也都合规合矩;在语法、句法、用韵、意象搭配等方面也都有不错的表现。但在情感表达的丰富程度、个体体验和创作时不拘一格的构思方面明显不足。相较而言,此轮比赛整体上百度AI+、Kimi稍胜一筹,豆包次之,DeepSeek位居末席。
第二轮测试,要求4个AI模型以《游雁荡山灵峰》为题写一首五律,重点测试是否能够写出灵峰的特点以及耳目所及的状貌声色之美。出题后不到一秒钟,豆包和百度AI+都提交了答卷。Kimi先提交的是七律,询问后,不到一秒,又提交了一首五律。Deep Seek R1则在洋洋洒洒说明了五律的作法,四联的构思和如何写作,然后检查平仄和押韵是否符合五律的要求,考虑是否有用典或化用前人诗句后才给出了答案。最后,又对自己写的诗作了赏析,阐述了诗中的意象和情感表达,说明了如何通过自然景观的描绘传达出灵峰的幽奇与游人的心境变化。
Kimi:游雁荡山灵峰
翠嶂连天际,灵峰入画中。
云低藏古寺,雾起隐仙踪。
石径通幽处,清溪绕碧峰。
心随山水远,归路意无穷。
简析:整体上遣词炼句清新自然,营造出静谧空灵的意境,契合山水诗风格。尾联直抒胸臆,表达出沉醉山水、流连忘返的心境,让读者能深切感受到在这场山水之旅中的心灵触动与无尽回味。可酌之处是意象在传统山水诗中较为常见,没有抓住灵峰独特的意象组合与夜景特点。中两联第三字动词同位,有摞眼之嫌,颈联对仗也欠工稳。
豆包:游雁荡山灵峰
暮色入灵峰,烟岚逸韵浓。
岩姿呈万象,洞影隐千重。
古寺钟声远,幽林鸟语逢。
悠然寻胜处,逸兴漫心胸。
简评:暮色下的灵峰,烟岚、岩姿、洞影、古寺钟声、幽林、鸟语等元素相互交织,营造出一种宁静、幽远、空灵的意境,给人以美的享受。用词简洁而富有表现力,给人以丰富的想象空间。在描绘景物的同时,表达了自己悠然自得、逸兴满怀的情感,使读者能够感受到诗人对灵峰美景的喜爱之情。不足之处在于描写的都是寻常的意象,没有独特的视角或新颖联想观察描写灵峰不同寻常的特点。此外,开篇已点出暮色,但未能展现暮色中灵峰移步换形,变幻多姿的夜景。
Deep Seek R1:游雁荡山灵峰
秋霁向灵岑,千崖气肃森。
合流喧涧底,孤月避云心。
石罅龙蛇字,风清钟梵音。
夜来窥斗柄,或恐坠衣襟。
简评:首联总写秋日初晴后游灵峰所见之景。中两联展现雁荡山灵峰的雄奇与幽深。尾联“夜来窥斗柄,或恐坠衣襟”以夸张手法,将星斗之近与衣襟相接,既显山势之高峻,又寓含对自然伟力的敬畏,诗意盎然,令人回味。不足之处是缺乏对灵峰美不胜收景色个性特点的深入观察和描写,没有写出灵峰独特夜景的代表性景观。游后感发也较为含蓄,难以引起与读者的共情。
百度AI+:游雁荡山灵峰
灵峰雁荡间,秀色自天成。
峭壁千重嶂,奇峰万仞屏。
云浮山色远,雾绕树荫清。
此景常相忆,何须远访仙。
简评:开篇切题概括灵峰天然秀色,中两联词性相对,在结构和意义上也相互对应,展现出律诗的形式美与对称美。可酌之处在于没有抓住灵峰的个性特点,首联出句犯题嫌累赘,“峰”“色”无由重复,尾联落韵。描写视角也较单一,表现手法和意象组合上没有特别新颖之处。
雁荡山灵峰以悬崖叠嶂、奇峰怪石、古怪石室、碧潭清润而著称。景区内层峦叠嶂,奇峰环绕,千形万状,美不胜收。尤灵峰夜景,移步换形,变幻多姿,妙不可言。两大奇洞观音洞、北斗洞为游人所必至,合掌峰是雁荡山的代表景观之一。山水诗是描写山水风景的诗,好的山水诗应能融会山水的精神内涵,也须把握山水的个性特点,更要展现山水的人文情怀。需要显示出风景独特的“这一个”,而不能移置于别处。由此可以得出Kimi、豆包、Deep Seek R1和百度AI+都没有把握住灵峰的个性特点,也没有深入融会灵峰的景色内涵,更没有显示出灵峰夜景移步换形的独特“这一个”,在借助灵峰景色抒发内心情绪上也略显单薄。相比较而言,此轮测试豆包、Kimi稍胜一筹,Deep Seek R1次之,百度AI+位居末位。
从两轮测试的结果,结合网络上经常看到的AI作的诗,可以看到AI在遵守诗的格律上,无论押韵、平仄,还是对仗方面,在语法、句法、用韵、意象搭配等方面都有不俗的表现,在运用表达技巧方面也令人刮目相看,其创作能力和水平确实能够超过当今80%的诗词爱好者。但在描写山川地貌的个性特点,凸显自身独特的审美意向上,比当今的优秀诗人尚有很大的差距。此外,由于对不同的内容和体裁的学习训练程度不同,优秀的AI写出的诗也不一定总是好的。
四、AI写诗与诗人写诗的区别和不足
根据以上比较结果,并参考网络相关资料,AI写诗与诗人写诗的区别,主要表现在以下几个方面。
1.是创作主体与过程有差别。AI写诗是人工智能基于程序算法和大量数据训练的结果,它通过学习海量诗词作品的语言规律、韵律、意象等要素,按照预设的程序和算法生成诗词。整个过程依据数据和算法驱动,缺乏人类的情感体验和主观意识。而诗人写诗是诗人个人情感、思想、经历与创造力的结晶,诗人在生活中感受自然、社会、人生等,产生独特的情感和思考,然后运用语言艺术和文学技巧进行创作,每首诗都蕴含着诗人的个性、价值观以及对世界的理解和感悟。
2.二是情感表达的丰富程度有差别。AI写诗虽能模拟人类情感表达,但情感相对单一、表面,是对已有诗词情感模式的模仿和拼凑,无法真正体验和理解人类内心深处复杂而微妙的情感,其情感表达往往缺乏深度、真挚度和感染力。而诗人写诗的情感表达丰富、深刻且真实,能够细腻地描绘出各种情感的层次和变化。诗人将自己的喜怒哀乐、爱恨情仇等融入诗词中,使读者能够深刻感受到诗人的心跳和呼吸,产生强烈的情感共鸣。
3.是语言与表达技巧的运用能力有差别。AI写诗语言运用较为规范、工整,遵循一定的语法规则和诗词体式,但在词汇选择、修辞手法运用等方面缺乏灵活性和创造性,其生成的诗歌语言相对较为平实、常规,难以达到人类诗人那种精妙绝伦、出神入化的语言艺术境界。而诗人写诗具有极高的语言驾驭能力和丰富的艺术技巧,他们能够巧妙地运用各种修辞手法,创造出独特的意象和意境,使诗词具有画面感、音乐美和节奏感。诗人还善于通过独特的语言风格和表现手法来展现自己的个性和创作理念,形成与众不同的艺术风格。
4.是主题与内容的广度有差别。AI写诗的主题和内容相对有限,通常围绕常见的诗词主题展开,且内容多为对已有诗词主题和意象的重新组合和演绎,缺乏对人类生活和社会现实的深入挖掘和独特见解,难以展现出深刻的思想内涵和广阔的社会视野。而诗人写诗的题材广泛多样,涵盖了人类生活的方方面面,诗人能够从平凡的事物中发现不平凡的意义,通过独特的视角和深刻的思考,赋予诗词丰富的思想内涵和时代价值,引发读者对社会、人生等问题的深入思考。
5.是原创性与创新性有差别。AI写诗本质上是对已有诗词数据的学习和模仿,其生成的诗词往往在结构和表达上存在一定的相似性,缺乏真正的原创性和创新性。而诗人写诗注重原创性和创新性,不断探索新的诗词形式、语言表达和主题内容。诗人通过独特的创作手法和艺术视角,打破常规,创造出具有独特个性和风格的诗词作品,可以为诗词艺术的发展注入新的活力和创造力。
由此可见,AI写诗虽然快速高效,但是它毕竟不是人,它只能按照人的指示进行创作,尤其是它没有生活体验、情感温度、创新意识,缺乏对现实世界的深入理解和认知能力,它始终是机械的、被动的、冰冷的,它只能写共性的东西,不能主动完成诗言志、缘情之个性功能。换句话说,目前AI写诗尚不具有属于诗人当下的个体体验、真挚情感和独立思辨,也缺少诗人创作时真诚的感动、细微的情感和别具一格的思考,不可能在创作过程中不断突破传统的束缚,尝试新的题材、表现手法和语言形式,为诗词的发展创新增添活力。
五、AI写诗评诗的发展趋势
目前AI写诗还存在一些问题,其权威性和公信力有待进一步建立和提升。但是,随着AI技术以一日千里的速度的加速迭代,AI写诗的能力水平也将不断提高,可以预见的发展趋势是:
1.AI算法将不断提升和优化自身的技术和质量。与大数据对接更紧密,其文本生产从简单算法升级为深度神经网络控制的新计算模型,诗语选用的精确度与规范度持续提升,诗文本结构也从松散向具有自洽逻辑的“对话性”结构进化,诗词作品质量将不断提高。
2.AI写诗与诗人的协作将更加紧密。诗人可借助AI生成初稿,再进行个性化修改,形成独特风格,“人机协作”模式将逐渐成为主流。
3.AI写诗的应用场景和领域将不断拓展。如文化旅游中为景点创作宣传诗词,还可与音乐、绘画等艺术形式结合,创造全新艺术表现形式。
六、结 语
1.诗词写作是个非常复杂的过程,仅仅靠AI擅长的数理逻辑,并不一定能写出一首好诗。AI没有情感没有灵魂没有主体意识,只会模仿创作,写出的诗目前还无法与既真且美、情辞并茂的真正的好诗相提并论。同样,人类诗人若在诗词创作过程中过度依赖AI的参与,势必会削弱诗人的主体性,导致其独立思考和创新能力下降,进而失去自身的创作风格和个性。
2.AI不具有人的创新性,没有人类创作者的独特情感,更没有李白的生花妙笔,它写不出具有新时代社会精神写照和烙印特征的、流传千秋万代的好诗词。因此,诗词界对AI写作大可不必有如临大敌、草木皆兵的紧迫和焦虑感,诗词爱好者也无需对其顶礼膜拜,或有借助其追逐名利的、不切实际的想法。
3、基于大数据的AI写诗,目前超越80%甚至更多的人是不言而喻的。但诗人和诗词爱好者没有必要引发恐慌,可以在写作的过程中把AI诗词创作评论作为一种灵感的来源,作为一种辅助的创作方式。通过人机协作,从中发现新的表达方式或主题,进而激发自己的创作灵感,为诗词创作注入新的活力和特色,写出具有超越性的、深层次情感共鸣的诗词作品。
4、诗词界和人工智能领域的交流协作是未来诗词发展的必然趋势。
2025年2月23日于北京
上一篇:无