DeepSeek “通情达理”这样炼成
看问题“更高一层”
当一个人感到困惑或焦虑时,和DeepSeek聊一聊,居然会有海阔天空的豁达感。
当你问它“战胜焦虑有什么办法吗”,它的回答是:放弃“立刻变好”的期待,允许自己带着焦虑生活,焦虑的消退像冰层融化,是悄无声息的过程。
你问它“养育孩子的意义是什么”,它会告诉你:请接受生命最温柔的“失败”。育儿手册里的标准答案并非万能,没有父母是完美的,总会遇到挫败,而这些挫败教会我们“爱不需要正确,只需要在场”。
还有人问它:一个人一生中没有挚友,也没有伴侣,能生活得开心吗?DeepSeek的回答是:人类对幸福的定义,从来就不是单行道。当我们剥离社会规训的滤镜,会发现生命的丰盛程度,远比传统叙事里的标配人生更为辽阔。有人在与星辰对话中获得灵魂共振,有人在古籍修复中触摸千年体温,更有人通过救助流浪动物构建情感网络。
你和它探讨“人生的意义是什么”,它认为:这不是一道填空题,而是一道论述题。它可能随着时间、经历而改变,少年时是梦想,中年时是责任,老年时是传承。它还告诉你,答案并不重要,这个问题本身会推动我们不断反思、连接他人,并在有限的生命里活得更清醒与热烈。
AI的自我进化
一些人在和DeepSeek聊天后不禁发出感慨:AI越来越知晓人情世故,人类却越活越像AI。DeepSeek的出现,改变了AI的哪些叙事逻辑?
不妨先从人工智能的发展主线说起。人工智能这一概念是在1956年达特茅斯学院研讨会上正式提出的。从此,AI便踏上了一条机器自我学习的新路线,即处理数据、提取特征、训练模型、改进性能、给出结果。
经历了若干代更迭后,一种新的算法出现,即具有记忆和优化功能的循环(递归)神经网络(简称为RNN)。可以把这种算法想象成一个有“记忆”的故事讲述者,它会把当前情节的信息和自己之前“记住”的信息结合起来,去理解和处理一些新情节。
20世纪80年代,人工智能界又出现了一种反向传播算法(简称BP算法)。想象一下,AI的BP算法就像是一个在迷宫中寻找出口的探险家,有了这种算法,探险家可以及时调整迷宫路线,让自己下次走的时候更容易找到出口。
进入21世纪后,大语言模型(LLM)成为AI界研究的主流。大语言模型就像一个知识渊博且能力不断突破的“超级大脑”——知识储备丰富,语言理解能力强,语言生成能力出色,学习和适应能力强,等等。
DeepSeek等AI的大语言模型,依赖的是算法、算力和数据三大基本要素。三者之间的关系可以用烹饪菜肴来形象地说明。
算法就像烹饪的菜谱,规定了食材(也就是数据)如何被处理和组合。菜谱详细介绍了每一步的操作步骤、调料用量以及烹饪的时间和火候等,就像算法规定了数据的处理流程、计算方法和逻辑顺序。
算力则是厨师的烹饪水平和厨房设备的性能。一个技艺高超的厨师(强大的算力)能够更快速、精准地按照菜谱的要求进行烹饪。同时,先进的厨房设备(高性能的计算硬件)也能帮助厨师更高效地完成烹饪任务。
数据就是烹饪所需的食材。没有丰富多样、高质量的食材,再精妙的菜谱和再厉害的厨师也无法做出令人满意的菜肴。
将“顿悟”精准展示
饺子导演的哪吒系列动画电影诞生了一句金句:“人心中的成见是一座大山”。DeepSeek以一己之力改变了AI领域的认知成见。
以前,AI领域普遍存在一种固化的技术认知,AI的大语言模型性能与算力投入呈正相关,他们强调“大力出奇迹”。而DeepSeek的出现直接证明了“算力不是唯一的标准”,算法创新也可以开出一条独辟蹊径的道路。
DeepSeek最让人惊艳的是向大家展示了它的思考过程。就像人类在解决难题时,意识到之前的思路有问题,还会停下来重新思考。这是AI首次展现出像人类一样的高阶思维和内心独白,这也是DeepSeek的独特之处。
其实这种现象是机器的“顿悟”,只不过DeepSeek将它进行了更为精确的表达。
对于这种现象,中国科学院院士陈润生曾这样解释:你训练神经网络的过程中,讲一遍它不懂,两遍也不懂,第四遍还不懂,第五遍一下学会了,就像小孩学东西一样,教一两遍不明白,教到N+1遍突然就学会了。
“顿悟”并不是DeepSeek最先发现的,OpenAI团队在2023年就在大模型训练时发现这一现象。但是,DeepSeek把这种顿悟写进了公开的技术文档里,并体现在应用的思考流程上,让用户看得到并且可以评判。
有趣的是,机器的这种领悟不是渐进式的,而是瞬间、突破性的,就像一个人在长期思考一个难题后,突然灵感乍现,恍然大悟。
更好地传递“衣钵”
随着AI大模型的参数越来越多,应用端在处理某些领域问题时其实用不上如此庞大的模型。目前,各AI公司都在研究蒸馏模型,这是一种常用的技术方法。DeepSeek在做蒸馏模型时也进行了一些巧妙设计。
就像老师教学生知识,从易到难逐步深入,学生更容易接受。DeepSeek对一些大、小模型进行渐进式分层蒸馏,比如保留大部分架构特性,让学生模型有个好基础;提升推理速度,让学生掌握快速解题的方法;优化决策路径,提高任务准确率,这样学生就能学会更高效的思考方式,能花更少的精力答对题。
蒸馏后的小模型,在推理能力上得到了显著提升,甚至超越了这些小模型自我基础上进行强化学习的效果。这一过程就好像是从一大杯浓郁的咖啡中提取出一小杯精华的浓缩咖啡,保留了咖啡的风味和香气,也就是大模型的核心知识和能力。通过模型蒸馏技术,小模型可以在计算资源受限的设备上运行,如手机、智能手表等,实现快速推理。就好比学生继承了老师的衣钵,最后独当一面,解决各种问题。
许多人担心,AI今后会取代人类。DeepSeek的回答是:AI不会取代人类,就像望远镜不会取代天文学家。真正的危机是:当AI可以24小时创作莎士比亚风格的十四行诗时,人类是否还愿意在深夜为爱人写一首笨拙的情诗?
在AI这条赛道上,创造和坚持,或许才是人类最坚固的护城河。
标签:
相关阅读
-
03-10
-
03-10
-
03-10
-
03-10
-
03-10
推荐阅读
-
-
我在两会“听”信心|“创新不止,科技发展一定会
今天的中国,科技春潮加速奔涌;今年的两会,创新成果被代表委员和部长们频频点赞。AI大模型、人形机器人、国产原创药、新能源汽车……各领更多
2025-03-10 15:56:26
-
-
新华全媒+|中国下一代“人造太阳”关键系统验收
中国下一代人造太阳又建成了一项关键系统!记者9日从中国科学院合肥物质科学研究院获悉,该院大科学团队研制的聚变堆主机关键系统综合研究更多
2025-03-10 15:53:23
-
-
两会看“新”|脑机接口,“接”入未来
春风吹拂的北京,举世瞩目的全国两会上,科技领域创新备受关注。今年的政府工作报告提出,充分发挥新型举国体制优势,强化关键核心技术攻关更多
2025-03-10 15:52:08
-
-
两会看“新”|量子计算,未来已来
2025年全国两会上,其中,来自科技领域的声音格外引人关注。全国人大代表、中国科学院量子信息重点实验室副主任郭国平,带着对量子计算技术更多
2025-03-10 15:49:13
-
-
两会看“新”|具身智能,前景几何?
今年的政府工作报告中提出,建立未来产业投入增长机制,培育生物制造、量子科技、具身智能、6G等未来产业。作为人工智能领域的前沿热点,具更多
2025-03-10 15:45:22
-
-
当AI“牵手”政务之后
锡企服务平台上线AI助手。  牵手热潮之后,各地应冷静下来细细思索,如何进一步拓展应用场景。毕竟,无论借助怎样高级的技术手段更多
2025-03-06 18:17:16
-
-
国产手术机器人:从“跟跑”到“并跑”
图① 观众观看一款手术机器人演示。新华社记者 鞠焕宗摄图② 骨科医疗手术机器人。视觉中国供图图③ 单孔腔镜手术机器人演示剥蛋壳。新更多
2025-03-06 18:15:15
-
-
综述|创新引领 共筑未来——中企参展世界移动通
新华社西班牙巴塞罗那3月5日电(记者单玮怡 康逸 张兆卿)作为全球移动通信行业的风向标,为期4天的2025年世界移动通信大会3日在西班牙巴更多
2025-03-06 17:45:52
时尚热图
热门标签
精彩放送
-
03-10
-
03-10
-
03-10
-
03-10
-
03-10
-
03-10
-
03-10
-
03-10
-
03-10
-
03-10
-
03-10
-
03-09
-
03-09
-
03-09
-
03-09
-
03-09
-
03-09
-
03-09
-
03-09
-
03-09
-
03-09
-
03-09
-
03-09
-
03-09
-
03-09
-
03-09
-
03-08
-
03-08
-
03-08
-
03-08
-
03-08
-
03-08
-
03-08
-
03-06
-
03-06
-
03-06
-
03-06
-
03-06
-
03-06
-
03-06
-
03-06
-
03-06
-
03-06
-
03-06
-
03-06
-
03-03
-
03-03
-
03-03
-
03-02
-
03-02
-
03-02
-
03-02
-
03-02
-
03-02
-
03-02
-
03-02
-
03-02
-
03-02
-
03-02
-
03-02
-
03-02
-
03-02
-
03-02
-
03-02
-
03-02
-
02-28
-
02-28
-
02-28
-
02-28
-
02-28
-
02-28
-
02-28
-
今日必看
-
精彩话题
-
今日推送
- 新华鲜报|嫦娥六号月背样品又有新发现!为验证月球岩浆洋假说补上月背“拼图”
- 中国经济面面观|聚焦中国AI大模型之一:阿里巴巴专家解读AI与手机深度融合前景
- 为中国航天事业不断提供“澎湃力量”——航天四院42所奋进逐梦“一甲子”
- 食品安全重于泰山,朝阳区代表团探访顺鑫石门取经
- 瑞幸咖啡2024年收入344.75亿创新高,股价大涨7.82%
- 吉林延边成韩国游客度周末热选 将推出定制游
- 户外运动玩出大产业
- 多家上市航司披露1月份运营数据 客运运力投入集体增长
- 数据见证新春冰雪经济新活力
- “辽东绿肺 山水清原” 清原县亮相《300秒看家乡》
- 300秒看家乡︱企业篇:莫尔道嘎森工公司的奋进篇章
- 多地出实招 进一步挖掘文旅市场消费潜能
- 节后出境游市场迎错峰潮
- “诗意山水 滋味宿松” 宿松县亮相《300秒看家乡》
- “中国行”热情高涨 浦东机场外国游客入境忙
- 山海逐梦,母爱启程 | 2025乳山半马报名即将启动
- 车险怎么买最省钱?
- 机器人忙开学 浙江科技“迎新”
- 青藏高原第一只人工繁殖斑海豹幼崽出生
- 陕西两地发布重污染天气黄色预警 启动Ⅲ级应急响应
- 浙江完成单村水站改造提升逾8000座 受益人口218万
- 除夕至元宵节 各地“传统村落过大年”吸引游客突破4720万人次
- 陇南“达嘎姐妹”的节日狂欢
- 江西赣州:百年“唱船”史 悠悠祈福意
- 基层民警“送菜”记:一场600多天的爱心接力
- 2025年全国龙狮大联动启动仪式在佛山举行
- 四川首例网络“刷单炒信”公益诉讼胜诉
- 中国科学家合成毫米级“陨石钻石”
- 我在大学编百科词条
- 新冷空气影响我国 中东部将有雨雪天气南方伴有春雷
- 太空出差满百天 神十九乘组各项工作进展如何?
- 江西南昌:不误农时 备足农资保春耕
- 通讯:行走在大漠深处的“流动供销社”
- 送别!那个为祖国“深潜”的人,走了!
- 重庆实施“八大行动”推进超大城市现代化治理示范区建设
- 传统文化短视频创作者李子柒给大家拜年了
- 洛邑古城 人间烟火气
- 春节假期餐饮消费烟火气升腾
- 全国科技馆春节期间接待观众超300万人次
- 春节假期北京重点商圈客流量超过3500万人次
- 消费新图景 发展新动能——春节假期消费市场扫描
- 春节文旅热折射经济活力足
- (新春走基层)探访侨乡台山镇海湾:鹭鸟成群飞翔 红树郁郁葱葱
- 山西大同“内外兼修”构建就业生态系统
- 福建宝藏小城迎“新客” 入境游持续深入
- 多地打造“家门口”就业服务圈 探索破解零工群体就业难题
- 强冷空气将影响中东部地区 中央气象台发布大风黄色预警
- 哈尔滨冰雪大世界春节期间单日游客量突破10万人次
- “华人老家”山西洪洞大槐树年味浓 游客畅享欢乐
- 广东漳溪畲族乡举行汶水塘捕鱼节