2026年水木金卷高考模拟试卷精编语文


注:目前有些书本章节名称可能整理的还不是很完善,但都是按照顺序排列的,请同学们按照顺序仔细查找。练习册 2026年水木金卷高考模拟试卷精编语文 答案主要是用来给同学们做完题方便对答案用的,请勿直接抄袭。



《2026年水木金卷高考模拟试卷精编语文》

第302页
阅读下面的文字,完成4~6题。
材料一
近年来,人工智能技术与人文历史研究碰撞出不少火花,那么,AI(人工智能)对于古代汉语的理解能力怎么样?
日前,北京师范大学中文信息处理与古典文献学专业的研究者们尝试训练一个“饱读诗书”的语言模型,并让 AI 来参与古籍整理的工作。模型学习的对象包括《四库全书》与“殆知阁”语料库,而学习的方法则来自语言智能领域最新的深层语言模型。
2018年,谷歌公司曾推出了深层语言模型 BERT,它在阅读理解等 11 项语言理解任务中刷新纪录。和之前的方法相比,深层语言模型一是可以吞吐超大量的数据,二是有很强的记忆和理解能力。现有的深层语言模型覆盖了英文和中文,但却不具备理解古汉语的能力。于是,研究者们希望通过上述海量的古汉语数据来让机器“感受”一下博大精深的诗书礼乐文化。在多块计算卡上并行训练了约一周时间后,古汉语 BERT 初出江湖,AI 可以像人一样联系上下文理解字词含义,并将其以数学向量表示。
为了检测其理解效果,研究者们引入了句读任务。因为在古典文史学习过程中,句读通常是必备的基本功。古文句读不仅需要考虑当前文本的语义和语境信息,还需要综合历史文化常识,对古汉语知识有较高要求。宋代大儒朱熹读韩愈文章,便有“然不知此句当如何读”之惑。在句读的过程中,有三项重要的技能点:利用古汉语特有的节奏和韵律感,联系上下文语境信息推敲求解,调用文本之外的历史文化知识。
虽然现在很多古代经典都出版了标点本,但其中常常包含错误,并且,在现有的古籍数据中,大部分文献仍未实现句读。据统计,“殆知阁”古代文献藏书 2.0 版语料库规模约 33 亿字,其中仅25%左右的数据包含标点。如果依靠人工继续整理这些古籍,则不知何年何月才能整理到头。如果依靠计算机,现有的技术方法却普遍只能达到 60%~70%的准确率,还很难为人所用。
为了让 AI 在理解文义的基础上具备句读功能,研究者们准备了大量带标点的数据,包括超过 30 万首古诗,2 万余首词,800 多万段古文,模型还引入了处理标签序列的机制来专门学习句读方法。由于诗词具有较为明显的格律特征,如大部分古诗为四五六言,而词牌名可以提示断句规则,为了帮助模型更好地学习语义和韵律信息,在预处理数据时保留了古诗题目,并去除词牌名。
在多块计算卡上并行学习了数天句读后,模型终于“出山”。在测试环节,研究者们引入了两轮难度不同的实验。普通版测试对象为一批模型从来没见过的诗词古文数据(古诗 5 000 首,词 2 000 首,古文 5 000 段),实验中,模型在诗、词、古文的句读准确率上分别超过了 99%、95%和 92%,较之已有的自动断句方法取得了巨大提升。升级版测试对象为已出版古籍中的句读疑难案例。根据司马朝军等学者的研究,从中华书局出版的《钦定四库全书总目》《周礼正义》中抽取出了 60 则句读误例(排除了模型训练时见过的数据)。这两本古籍均由该领域专家完成整理和句读标点,并经多次校对,其中的误例可谓句读任务的难点所在。研究人员从司马朝军的研究中找出了《钦定四库全书总目》中 11 则与句读相关的错误,发现模型可以完全做对 8 则。又选择了王文锦等人点校的《周礼正义》一书,将颜春峰等人整理的 49 则断句误例送入模型测试。其中,模型能完全正确断句 27 则,断句存在问题的有 22 则。
总的来说,模型在已出版古籍的断句疑难误例上取得了很好的效果,测试共计 60 例(均为专家标点错误,并经多次校对未查出),而模型竟能完全正确断句 35 例,可以说达到了较为实用的水平。
从应用角度看,这里的句读方法既可以用于大规模古籍整理中的预断句工作,大大减轻专家负担,也可用于校对环节,帮助检测人工断句或标点的错误。在后续工作中,除了提升已有的句读模型,还希望将基于深层语言模型的古汉语知识表示方法应用到古文翻译、古诗文创作等其他古汉语信息处理任务中。
(摘编自胡韧奋、李绅、诸雨辰《让 AI 一口气读完〈四库全书〉会怎样?》)
材料二
2024 年 8 月 27 日,北京师范大学古汉语大语言模型“AI 太炎 2.0”发布会暨数智时代应用语言学学科建设路径与方法座谈会在京举行。
“AI 太炎”是国家语言文字工作委员会重大项目“古籍整理智能化关键技术研究”的核心成果,是专门适用于古汉语文本理解的大语言模型。该模型是针对古汉语信息处理任务的特点,从头构建的专门适用于古汉语文本理解的大语言模型。该模型具有较强的古典文献释读能力,支持词义注释、文白翻译、句读标点、用典分析等多种具有挑战性的文言文理解任务,且兼容繁简中文输入。此外,在辅助古籍整理、辞书编纂和语言研究等方面,该模型也表现出了很大的应用潜力。
据悉,“AI 太炎 1.0 版”于 2023 年 11 月进入内测阶段,学术科研、基础教育、编辑出版等不同行业领域的 4 000 余名用户参与内测,为模型改进提出了宝贵建议。研究团队在此基础上对模型进行了持续迭代优化,并发布了该模型 2.0 版,以期更好地助力古籍整理、文言文教学和古汉语信息处理研究。
(摘编自《古汉语大语言模型“AI 太炎 2.0”发布会在京举行》,《中国教育报》)
4. 下列对材料相关内容的理解和分析,不正确的一项是 (
C
)
A. 以往语言模型无法吞吐超大量的数据,也没有强劲的记忆和理解能力,深层语言模型在这两方面具有优势。
B. 研究者们在预处理数据时保留了古诗题目,并去除词牌名,旨在帮助模型更好地学习语义和韵律信息。
C. 古典文献释读是“AI 太炎”模型具有的重要功能,这一模型能应对多种具有挑战性的古文理解难题以及语言研究方面的困境。
D. 基于科研、教育等不同领域用户的参与以及他们对模型提出的改进建议,“AI 太炎 2.0 版”得以顺利发布。
5. 小刚在阅读上述材料后,绘制了一幅思维导图。请结合材料内容判断,下列对思维导图的解说不正确的一项是 (
A
)

A. ①处适合填写“研究理念”
B. ②处的概括描述不够准确
C. ③处适合填写“实验测试”
D. ④处适合填写“功能特点”
6. 刘教授是一名已退休的古代汉语教授,近期他正在研读一本冷门的中国古代典籍,但仅靠个人之力,时常感到力不从心,你向他推荐 AI 模型作为辅助工具,在交流情境中以下各项中不适合作为推荐要点的一项是 (
D
)
刘教授:相关的介绍我也看了,但感觉没什么必要。AI 学习的都是现成的句读材料,对没见过的文献未必有效吧? 况且我看它的正确率也没有特别高,那我不是还需要再校对一遍,工作量更大了吗? 学习古汉语还是要老老实实读出版的纸质书,不能相信那新鲜玩意。
A. AI 引入了处理标签序列的机制来专门学习句读方法,能应对没见过的文献,且 AI 在大量未见过的句读数据处理中表现优秀,正确率超过九成。
B. AI 可以用于大规模古籍整理中的预断句工作,大大减轻专家负担,也可用于校对环节,帮助检测人工断句或标点的错误。
C. 当下出版的标点本常常包含错误,而 AI 在已出版古籍的断句疑难误例上取得了很好的效果,达到了较为实用的水平。
D. 近年来 AI 技术发展迅速,已经进入我们生活的方方面面,而且与人文历史研究也碰撞出不少火花,我们应该积极拥抱新事物,不能因为 AI 是“新鲜玩意”就不相信。
答案: 4.C [命题立意]本题考查理解材料有关内容的能力。
[解析]由材料二第二段“在辅助古籍整理、辞书编纂和语言研究等方面,该模型也表现出了很大的应用潜力”可知,“这一模型能应对多种具有挑战性的古文理解难题以及语言研究方面的困境”说法有误。故选C。
5.A [命题立意]本题考查理解材料有关内容的能力。
[解析]A项,由材料一第一段“近年来,人工智能技术与人文历史研究碰撞出不少火花”可知,①处适合填写“研究背景”,选项表述有误。B项,由材料一第二段“而学习的方法则来自语言智能领域最新的深层语言模型”可知,②处的概括描述不准确,学习方法的来源不能等同于学习方法,选项表述正确。C项,由材料一第七段“在测试环节,研究者们引入了两轮难度不同的实验。普通版测试……升级版测试……案例”可知,③处适合填写“实验测试”,选项表述正确。D项,由材料二第二段“该模型具有较强的古典文献释读能力,支持词义注释、文白翻译、句读标点、用典分析等多种具有挑战性的文言文理解任务,且兼容繁简中文输入”等内容可知,④处适合填写“功能特点”,选项表述正确。故选A。
6.D [命题立意]本题考查根据原文内容进行推断的能力。
[解析]针对刘教授认为“不能相信那新鲜玩意”,可以结合材料二第三段“学术科研、基础教育、编辑出版等不同行业领域的4000余名用户参与内测,为模型改进提出了宝贵建议。研究团队在此基础上对模型进行了持续迭代优化”为刘教授推荐,可以说AI模型由数千名各行业人士参与测试,它的古典文献释读能力强,且经历了持续迭代优化,其能力是可信的。D项侧重于从态度上拥抱新事物,没有针对刘教授的疑虑进行推荐。故选D。

查看更多完整答案,请扫码查看

关闭