第29页
- 第1页
- 第2页
- 第3页
- 第4页
- 第5页
- 第6页
- 第7页
- 第8页
- 第9页
- 第10页
- 第11页
- 第12页
- 第13页
- 第14页
- 第15页
- 第16页
- 第17页
- 第18页
- 第19页
- 第20页
- 第21页
- 第22页
- 第23页
- 第24页
- 第25页
- 第26页
- 第27页
- 第28页
- 第29页
- 第30页
- 第31页
- 第32页
- 第33页
- 第34页
- 第35页
- 第36页
- 第37页
- 第38页
- 第39页
- 第40页
- 第41页
- 第42页
- 第43页
- 第44页
- 第45页
- 第46页
- 第47页
- 第48页
- 第49页
- 第50页
- 第51页
- 第52页
- 第53页
- 第54页
- 第55页
- 第56页
- 第57页
- 第58页
- 第59页
- 第60页
- 第61页
- 第62页
- 第63页
- 第64页
- 第65页
- 第66页
- 第67页
- 第68页
- 第69页
- 第70页
- 第71页
- 第72页
- 第73页
- 第74页
- 第75页
- 第76页
- 第77页
- 第78页
- 第79页
- 第80页
- 第81页
- 第82页
- 第83页
- 第84页
- 第85页
- 第86页
- 第87页
(二)(新素材·人工智能)阅读下面的材料,完成后面题目。
[材料一]
大模型创新的另一种可能
陈 杰
①自ChatGPT(一款人工智能聊天机器人程序)横空出世,算力便被视作大模型产业创新的核心驱动力。这一趋势使得GPU(图形加速芯片)的地位急速攀升,甚至成为AI(人工智能)产业发展的关键制约因素,也就是我们常常听到的“卡脖子”。
②然而,这种趋势却被我国一家成立仅一年半的人工智能创业公司深度求索(下称DeepSeek)终结。近日,DeepSeek仅凭借2048张英伟达GPU加速卡,在短短两个月内成功训练出拥有6710亿参数的开源大模型DeepSeek-V3,着实让刚高呼着进入“万卡”时代(1万张以上的加速卡组成的算力系统)的AI大模型产业界惊掉了一地的“下巴”。
③从测评数据来看,相对于全球公认的顶级大模型GPT-4o,DeepSeek-V3的训练成本仅仅为GPT-4o的二十分之一、输入+输出的售价也只有GPT-4o的十分之一,性能已然赶超GPT-4o。
④还处在研发阶段的GPT-5,或许更强。但OpenAI(开放人工智能)立项GPT-5已经一年半有余,目前也只做了两轮训练,且每轮训练仅计算成本就接近5亿美元。这也意味着,人们所期待的新一代通用大模型训练成本已经达到十数亿美元,甚至还会更高。产业界估计,按照这种传统的训练路径,未来3年内大模型的训练成本将上升至100亿美元,甚至上不封顶。
⑤这种大参数、大算力、大投入的研发模式,对于实力稍弱的AI企业来说,无疑是一道难以逾越的门槛。即便能“组局”成功,这种成本结构下产出的大模型产品,又有多少人能用得起呢?
⑥再来看DeepSeek-V3,它证明了即使在硬件资源有限的情况下,通过数据与算法层面的优化创新,依然能够高效利用算力,实现一流的大模型性能,同时还能大幅降低应用成本。其实,早在2024年5月发布的DeepSeek-V2,就成功以“价格屠夫”的方式杀入市场,让一众大模型产品不得不跟进降价。“AI界拼多多”的称号,绝非浪得虚名。
⑦性价比方面,DeepSeek已经甩了OpenAI等业界大佬好几条街了。在AI领域,一直有这样的说法:硅谷企业擅长从0到1的创新,而中国企业则在从1到10的应用拓展上更具优势,因为中国拥有广阔的应用市场。
⑧对于大模型产业而言,性价比已成为阻碍产业规模化应用的关键因素,DeepSeek的出现为解决这一难题提供了新思路。
⑨当前,AI大模型仍处于技术创新的爆发阶段,距离应用的全面爆发还有一段路要走,这也意味着产业发展充满变数与机遇。不可否认,今天的英伟达市值逆天、GPU产品也供不应求,但如果DeepSeek的成功可以复制,产业界不再执着于万卡集成的研发路径时,GPU的主导地位还能持续多久呢?
⑩大模型创新的另一种可能,不仅出现在AI产业,通信、芯片、量子计算等前沿科技领域也正悄然发生着改变。科技创新的魅力在于,它永远蕴含着无限的可能性,并不断突破边界。
(选自《科普时报》,有删改)
[材料二]
①2025年2月2日,据彭博社报道,由DeepSeek开发的人工智能助手在全球范围内掀起了一股热潮。这款推理型AI聊天机器人自今年初发布以来,迅速攀升至140个国家的苹果在线商店下载排行榜首位,并在美国的安卓在线商店中同样占据榜首位置。
②根据某市场分析公司的数据,DeepSeek应用程序于1月26日首次登上苹果在线商店的榜首,并持续保持其全球领先的地位。数据显示,印度成为新用户增长的最大来源地,贡献了所有平台下载量的15.6%。
③DeepSeek不仅因其与世界顶尖AI机器人相媲美的能力而受到赞誉,更因其实现了低成本运行而备受关注。这款应用在发布的前18天内就实现了1600万次的下载,几乎是ChatGPT同期下载量的两倍。
(选自“环球网”,有删改)
[材料三]
算法原理
DeepSeek大语言模型系以Transformer(一种人工智能模型)架构为基础,自主研发的深度神经网络模型。模型基于注意力机制,通过海量语料数据进行预训练,并经过监督微调、人类反馈的强化学习等进行对齐,构建形成深度神经网络,并增加审核、过滤等安全机制,使算法模型部署后能够根据人类的指令或者提示,实现语义分析、计算推理、问答对话、篇章生成、代码编写等任务。
算法目的
DeepSeek大语言模型旨在通过智能问答、代码生成等应用场景为用户提供创作、工作和提效的工具。高效便捷地帮助人们获取信息、知识和灵感。
主要用途
DeepSeek大语言模型应用于智能对话场景,服务于企业端客户,根据用户输入的文本数据,通过大语言模型生成符合用户需求的文本、代码等内容。
DeepSeek大语言模型直接向用户或者支持开发者,提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景。
主要优势
DeepSeek-V3质量高于平均水平,各项评估得出的质量指数为80。
DeepSeek-V2API(提供人工智能服务的接口)的定价为:每百万Tokens输入1元、输出2元。DeepSeek-V3这个参数量高达671B的大模型,在预训练阶段仅使用2048块GPU训练了2个月,且只花费557.6万美元。其训练费用相比GPT-4等大模型要少得多。DeepSeek-V3比平均价格更便宜,每100万个Token的价格为0.48美元。其中,输入Token价格为每100万个Token0.27美元,输出Token价格为每100万个Token1.10美元。
(选自“百度百科”,有删改)
5. 下列表述与以上材料不相符的一项是( )
A. 材料一第④段主要说明了OpenAI立项的ChatGPT-5投入的研发时间长,耗费的资金多,研发成本很高。
B. DeepSeek-V3实现一流的大模型性能主要是通过数据与算法层面的优化创新,从而高效利用了有限的算力。
C. 当前国际上AI大模型处于技术创新和应用的全面爆发阶段,但AI产业发展还充满变数与机遇,还需要努力。
D. 材料三通过具体数据告诉我们DeepSeek-V3具有质量高而成本低的性价比优势,这也将使它拥有更大的市场。
6. 请用一句简短的话概括材料二①②段这则消息的主要内容。______
7. 赏析下面语句,回答括号内的问题。
(1)近日,DeepSeek
(2)“AI
8.(创意表达)为了限制中国人工智能产业的发展,美国政府出台禁令,限制英伟达出口高性能的GPU到中国。请结合以上文本,就如何解决“卡脖子”的问题提两点建议。______
[材料一]
大模型创新的另一种可能
陈 杰
①自ChatGPT(一款人工智能聊天机器人程序)横空出世,算力便被视作大模型产业创新的核心驱动力。这一趋势使得GPU(图形加速芯片)的地位急速攀升,甚至成为AI(人工智能)产业发展的关键制约因素,也就是我们常常听到的“卡脖子”。
②然而,这种趋势却被我国一家成立仅一年半的人工智能创业公司深度求索(下称DeepSeek)终结。近日,DeepSeek仅凭借2048张英伟达GPU加速卡,在短短两个月内成功训练出拥有6710亿参数的开源大模型DeepSeek-V3,着实让刚高呼着进入“万卡”时代(1万张以上的加速卡组成的算力系统)的AI大模型产业界惊掉了一地的“下巴”。
③从测评数据来看,相对于全球公认的顶级大模型GPT-4o,DeepSeek-V3的训练成本仅仅为GPT-4o的二十分之一、输入+输出的售价也只有GPT-4o的十分之一,性能已然赶超GPT-4o。
④还处在研发阶段的GPT-5,或许更强。但OpenAI(开放人工智能)立项GPT-5已经一年半有余,目前也只做了两轮训练,且每轮训练仅计算成本就接近5亿美元。这也意味着,人们所期待的新一代通用大模型训练成本已经达到十数亿美元,甚至还会更高。产业界估计,按照这种传统的训练路径,未来3年内大模型的训练成本将上升至100亿美元,甚至上不封顶。
⑤这种大参数、大算力、大投入的研发模式,对于实力稍弱的AI企业来说,无疑是一道难以逾越的门槛。即便能“组局”成功,这种成本结构下产出的大模型产品,又有多少人能用得起呢?
⑥再来看DeepSeek-V3,它证明了即使在硬件资源有限的情况下,通过数据与算法层面的优化创新,依然能够高效利用算力,实现一流的大模型性能,同时还能大幅降低应用成本。其实,早在2024年5月发布的DeepSeek-V2,就成功以“价格屠夫”的方式杀入市场,让一众大模型产品不得不跟进降价。“AI界拼多多”的称号,绝非浪得虚名。
⑦性价比方面,DeepSeek已经甩了OpenAI等业界大佬好几条街了。在AI领域,一直有这样的说法:硅谷企业擅长从0到1的创新,而中国企业则在从1到10的应用拓展上更具优势,因为中国拥有广阔的应用市场。
⑧对于大模型产业而言,性价比已成为阻碍产业规模化应用的关键因素,DeepSeek的出现为解决这一难题提供了新思路。
⑨当前,AI大模型仍处于技术创新的爆发阶段,距离应用的全面爆发还有一段路要走,这也意味着产业发展充满变数与机遇。不可否认,今天的英伟达市值逆天、GPU产品也供不应求,但如果DeepSeek的成功可以复制,产业界不再执着于万卡集成的研发路径时,GPU的主导地位还能持续多久呢?
⑩大模型创新的另一种可能,不仅出现在AI产业,通信、芯片、量子计算等前沿科技领域也正悄然发生着改变。科技创新的魅力在于,它永远蕴含着无限的可能性,并不断突破边界。
(选自《科普时报》,有删改)
[材料二]
①2025年2月2日,据彭博社报道,由DeepSeek开发的人工智能助手在全球范围内掀起了一股热潮。这款推理型AI聊天机器人自今年初发布以来,迅速攀升至140个国家的苹果在线商店下载排行榜首位,并在美国的安卓在线商店中同样占据榜首位置。
②根据某市场分析公司的数据,DeepSeek应用程序于1月26日首次登上苹果在线商店的榜首,并持续保持其全球领先的地位。数据显示,印度成为新用户增长的最大来源地,贡献了所有平台下载量的15.6%。
③DeepSeek不仅因其与世界顶尖AI机器人相媲美的能力而受到赞誉,更因其实现了低成本运行而备受关注。这款应用在发布的前18天内就实现了1600万次的下载,几乎是ChatGPT同期下载量的两倍。
(选自“环球网”,有删改)
[材料三]
算法原理
DeepSeek大语言模型系以Transformer(一种人工智能模型)架构为基础,自主研发的深度神经网络模型。模型基于注意力机制,通过海量语料数据进行预训练,并经过监督微调、人类反馈的强化学习等进行对齐,构建形成深度神经网络,并增加审核、过滤等安全机制,使算法模型部署后能够根据人类的指令或者提示,实现语义分析、计算推理、问答对话、篇章生成、代码编写等任务。
算法目的
DeepSeek大语言模型旨在通过智能问答、代码生成等应用场景为用户提供创作、工作和提效的工具。高效便捷地帮助人们获取信息、知识和灵感。
主要用途
DeepSeek大语言模型应用于智能对话场景,服务于企业端客户,根据用户输入的文本数据,通过大语言模型生成符合用户需求的文本、代码等内容。
DeepSeek大语言模型直接向用户或者支持开发者,提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景。
主要优势
DeepSeek-V3质量高于平均水平,各项评估得出的质量指数为80。
DeepSeek-V2API(提供人工智能服务的接口)的定价为:每百万Tokens输入1元、输出2元。DeepSeek-V3这个参数量高达671B的大模型,在预训练阶段仅使用2048块GPU训练了2个月,且只花费557.6万美元。其训练费用相比GPT-4等大模型要少得多。DeepSeek-V3比平均价格更便宜,每100万个Token的价格为0.48美元。其中,输入Token价格为每100万个Token0.27美元,输出Token价格为每100万个Token1.10美元。
(选自“百度百科”,有删改)
5. 下列表述与以上材料不相符的一项是( )
A. 材料一第④段主要说明了OpenAI立项的ChatGPT-5投入的研发时间长,耗费的资金多,研发成本很高。
B. DeepSeek-V3实现一流的大模型性能主要是通过数据与算法层面的优化创新,从而高效利用了有限的算力。
C. 当前国际上AI大模型处于技术创新和应用的全面爆发阶段,但AI产业发展还充满变数与机遇,还需要努力。
D. 材料三通过具体数据告诉我们DeepSeek-V3具有质量高而成本低的性价比优势,这也将使它拥有更大的市场。
6. 请用一句简短的话概括材料二①②段这则消息的主要内容。______
7. 赏析下面语句,回答括号内的问题。
(1)近日,DeepSeek
仅
凭借2048张英伟达GPU加速卡,在短
短
两个月内成功训练出拥有6710亿参数的开源大模型DeepSeek-V3。(句中加点的“仅”“短短”强调了什么?)______(2)“AI
界
拼
多
多
”的称号,绝非浪得虚名。(句中加点的“AI界拼多多”语言有何特色?)______8.(创意表达)为了限制中国人工智能产业的发展,美国政府出台禁令,限制英伟达出口高性能的GPU到中国。请结合以上文本,就如何解决“卡脖子”的问题提两点建议。______
答案:
5. C 解析:"AI大模型处于技术创新和应用的全面爆发阶段"表述有误,根据材料一第⑨段可知,当前,AI大模型仍处于技术创新的爆发阶段,距离应用的全面爆发还有一段路要走。
6. 示例:由DeepSeek 开发的人工智能助手在全球范围内掀起了一股热潮。
7.(1)示例:"仅"强调了DeepSeek人员所用的英伟达GPU加速卡个数不多,从侧面突出DeepSeek人员优化创新的能力强;"短短"强调了DeepSeek人员研发用时少,效率高。(2)"AI界拼多多"以人们熟悉的"拼多多"作比较,说明DeepSeek-V2以低价杀入市场,让其他大模型产品不得不跟进降价,语言生动形象。
8. 示例:① 在我们技术优势方面(如数据、算法)加大创新,弥补不足;② 进一步发挥我们应用拓展方面的优势;③ 进一步提高性价比,解决产业规模化应用的难题;④ 加大本国高性能GPU的研发力度。(答出两点即可)
6. 示例:由DeepSeek 开发的人工智能助手在全球范围内掀起了一股热潮。
7.(1)示例:"仅"强调了DeepSeek人员所用的英伟达GPU加速卡个数不多,从侧面突出DeepSeek人员优化创新的能力强;"短短"强调了DeepSeek人员研发用时少,效率高。(2)"AI界拼多多"以人们熟悉的"拼多多"作比较,说明DeepSeek-V2以低价杀入市场,让其他大模型产品不得不跟进降价,语言生动形象。
8. 示例:① 在我们技术优势方面(如数据、算法)加大创新,弥补不足;② 进一步发挥我们应用拓展方面的优势;③ 进一步提高性价比,解决产业规模化应用的难题;④ 加大本国高性能GPU的研发力度。(答出两点即可)
查看更多完整答案,请扫码查看