DeepSeek “通情达理”这样炼成
时间:2025-03-10 16:11:33来源:解放日报
 AI的进化速度正超乎大家的想象。如今的DeepSeek,不仅为你答疑解惑,甚至还能通情达理,与人心意相通,在某些方面可以胜任心理咨询师的角色。作为一个异军突起的AI,DeepSeek的“才华”惊艳了众人,它有何独特之处,不妨从其成长的底层逻辑梳理。

  看问题“更高一层”

  当一个人感到困惑或焦虑时,和DeepSeek聊一聊,居然会有海阔天空的豁达感。

  当你问它“战胜焦虑有什么办法吗”,它的回答是:放弃“立刻变好”的期待,允许自己带着焦虑生活,焦虑的消退像冰层融化,是悄无声息的过程。

  你问它“养育孩子的意义是什么”,它会告诉你:请接受生命最温柔的“失败”。育儿手册里的标准答案并非万能,没有父母是完美的,总会遇到挫败,而这些挫败教会我们“爱不需要正确,只需要在场”。

  还有人问它:一个人一生中没有挚友,也没有伴侣,能生活得开心吗?DeepSeek的回答是:人类对幸福的定义,从来就不是单行道。当我们剥离社会规训的滤镜,会发现生命的丰盛程度,远比传统叙事里的标配人生更为辽阔。有人在与星辰对话中获得灵魂共振,有人在古籍修复中触摸千年体温,更有人通过救助流浪动物构建情感网络。

  你和它探讨“人生的意义是什么”,它认为:这不是一道填空题,而是一道论述题。它可能随着时间、经历而改变,少年时是梦想,中年时是责任,老年时是传承。它还告诉你,答案并不重要,这个问题本身会推动我们不断反思、连接他人,并在有限的生命里活得更清醒与热烈。

  AI的自我进化

  一些人在和DeepSeek聊天后不禁发出感慨:AI越来越知晓人情世故,人类却越活越像AI。DeepSeek的出现,改变了AI的哪些叙事逻辑?

  不妨先从人工智能的发展主线说起。人工智能这一概念是在1956年达特茅斯学院研讨会上正式提出的。从此,AI便踏上了一条机器自我学习的新路线,即处理数据、提取特征、训练模型、改进性能、给出结果。

  经历了若干代更迭后,一种新的算法出现,即具有记忆和优化功能的循环(递归)神经网络(简称为RNN)。可以把这种算法想象成一个有“记忆”的故事讲述者,它会把当前情节的信息和自己之前“记住”的信息结合起来,去理解和处理一些新情节。

  20世纪80年代,人工智能界又出现了一种反向传播算法(简称BP算法)。想象一下,AI的BP算法就像是一个在迷宫中寻找出口的探险家,有了这种算法,探险家可以及时调整迷宫路线,让自己下次走的时候更容易找到出口。

  进入21世纪后,大语言模型(LLM)成为AI界研究的主流。大语言模型就像一个知识渊博且能力不断突破的“超级大脑”——知识储备丰富,语言理解能力强,语言生成能力出色,学习和适应能力强,等等。

  DeepSeek等AI的大语言模型,依赖的是算法、算力和数据三大基本要素。三者之间的关系可以用烹饪菜肴来形象地说明。

  算法就像烹饪的菜谱,规定了食材(也就是数据)如何被处理和组合。菜谱详细介绍了每一步的操作步骤、调料用量以及烹饪的时间和火候等,就像算法规定了数据的处理流程、计算方法和逻辑顺序。

  算力则是厨师的烹饪水平和厨房设备的性能。一个技艺高超的厨师(强大的算力)能够更快速、精准地按照菜谱的要求进行烹饪。同时,先进的厨房设备(高性能的计算硬件)也能帮助厨师更高效地完成烹饪任务。

  数据就是烹饪所需的食材。没有丰富多样、高质量的食材,再精妙的菜谱和再厉害的厨师也无法做出令人满意的菜肴。

  将“顿悟”精准展示

  饺子导演的哪吒系列动画电影诞生了一句金句:“人心中的成见是一座大山”。DeepSeek以一己之力改变了AI领域的认知成见。

  以前,AI领域普遍存在一种固化的技术认知,AI的大语言模型性能与算力投入呈正相关,他们强调“大力出奇迹”。而DeepSeek的出现直接证明了“算力不是唯一的标准”,算法创新也可以开出一条独辟蹊径的道路。

  DeepSeek最让人惊艳的是向大家展示了它的思考过程。就像人类在解决难题时,意识到之前的思路有问题,还会停下来重新思考。这是AI首次展现出像人类一样的高阶思维和内心独白,这也是DeepSeek的独特之处。

  其实这种现象是机器的“顿悟”,只不过DeepSeek将它进行了更为精确的表达。

  对于这种现象,中国科学院院士陈润生曾这样解释:你训练神经网络的过程中,讲一遍它不懂,两遍也不懂,第四遍还不懂,第五遍一下学会了,就像小孩学东西一样,教一两遍不明白,教到N+1遍突然就学会了。

  “顿悟”并不是DeepSeek最先发现的,OpenAI团队在2023年就在大模型训练时发现这一现象。但是,DeepSeek把这种顿悟写进了公开的技术文档里,并体现在应用的思考流程上,让用户看得到并且可以评判。

  有趣的是,机器的这种领悟不是渐进式的,而是瞬间、突破性的,就像一个人在长期思考一个难题后,突然灵感乍现,恍然大悟。

  更好地传递“衣钵”

  随着AI大模型的参数越来越多,应用端在处理某些领域问题时其实用不上如此庞大的模型。目前,各AI公司都在研究蒸馏模型,这是一种常用的技术方法。DeepSeek在做蒸馏模型时也进行了一些巧妙设计。

  就像老师教学生知识,从易到难逐步深入,学生更容易接受。DeepSeek对一些大、小模型进行渐进式分层蒸馏,比如保留大部分架构特性,让学生模型有个好基础;提升推理速度,让学生掌握快速解题的方法;优化决策路径,提高任务准确率,这样学生就能学会更高效的思考方式,能花更少的精力答对题。

  蒸馏后的小模型,在推理能力上得到了显著提升,甚至超越了这些小模型自我基础上进行强化学习的效果。这一过程就好像是从一大杯浓郁的咖啡中提取出一小杯精华的浓缩咖啡,保留了咖啡的风味和香气,也就是大模型的核心知识和能力。通过模型蒸馏技术,小模型可以在计算资源受限的设备上运行,如手机、智能手表等,实现快速推理。就好比学生继承了老师的衣钵,最后独当一面,解决各种问题。

  许多人担心,AI今后会取代人类。DeepSeek的回答是:AI不会取代人类,就像望远镜不会取代天文学家。真正的危机是:当AI可以24小时创作莎士比亚风格的十四行诗时,人类是否还愿意在深夜为爱人写一首笨拙的情诗?

  在AI这条赛道上,创造和坚持,或许才是人类最坚固的护城河。

标签:

最新
  • DeepSeek “通情达理”这样炼成

     AI的进化速度正超乎大家的想象。如今的DeepSeek,不仅为你答

  • 《哪吒2》票房一路冲高 光影盛宴背后的影院路在何方?

    《哪吒2》票房一路冲高,打破了一个又一个纪录,并让一众从业者赚得

  • 加快数智化转型步伐 居然之家正式更名“居然智家”

     新华网北京12月11日电(记者 王日晨)时隔1个多月后,居然之

  • 常州航仪厂改造提升项目(运河五号二期)正式开工

    12月2日,常州航仪厂改造提升项目(运河五号二期)开工仪式在五星街道

  • 彭小苒《暗河传》杀青,全新挑战杀手角色魅力爆表

    由优酷出品,尹涛总导演,周木楠同名原著改编并担任总编剧,彭小苒

  • 百位专家将合力编撰《特应性皮炎365问》

    中新网上海10月27日电 (记者 陈静)什么是特应性皮炎?什么样的人

  • 美联储降息落地!将如何影响我国经济?-全球视点

    美联储以50个基点的步伐开启此轮降息周期,对我国宏观经济和人民币

  • 环球快消息!2024贵阳国际网球公开赛女单决赛举行

    9月15日,2024贵阳国际网球公开赛女子单打项目决赛在贵州省贵阳市观

  • 西部陆海新通道:跨越山海 中国和东盟携手共赢

    中新网南宁9月9日电 题:西部陆海新通道:跨越山海中国和东盟携手

  • 南阳市宛城区法院:强化后勤巡检 确保审判安全有序_世界快消息

    在司法审判工作中,后勤保障起着至关重要的作用。去年以来,南阳市宛城

  • 新疆首条跨沙漠铁路750千伏超高压输变电工程全线贯通-天天热门

    今天上午,在新疆巴州焉耆县,随着最后一根导线横跨环塔克拉玛干沙

  • 揭秘小红书大牌护肤品“临期打折”陷阱

    原价1299元的兰蔻面霜,如今72元到手原价899元的兰蔻精华肌底液,折

  • 香港珠海学院硕士研究生申请难不难?|微资讯

    香港珠海学院硕士研究生申请难不难?香港珠海学院是充满活力的院校,已

  • 中国在清洁能源领域继续领先

    世界知名能源智库Ember近日发布研究报告,称赞中国在清洁能源领域取

  • 为更好的北京 华润置地北京30周年品牌发布会举办 今日热搜

    日前,30载,为更好的北京华润置地北京30周年品牌发布会于北京举办

  • ​罗山县市场监管局开展农资产品质量抽检为春耕生产保驾护航

    眼下正值春耕春播的关键时节,为进一步规范农资市场经营秩序,保障春季

  • 旅游
    • 九毛九:上半年营利双增!净利润同比增长285.12%

    • 5年期以上LPR利率意外按兵不动 什么原因?传递了怎样的信号

    • 南京江宁:城市守护联盟 风雨中他们一直在

    • 8月22日上海港鱼粉报价稳定为主