在全球AI竞争白热化的今天,DeepSeek以“国运级创新”横空出世,不仅刷新了国产大模型的技术高度,更点燃一场关于AI技术革命的热烈讨论。正是在这样的背景下,CSDN策划推出了“DeepSeek暨AI进化论十日谈”系列直播,旨在深入剖析DeepSeek所代表的技术创新如何重塑AI行业的未来。
这十场直播汇聚了顶级院校的AI学者、AI专家、AI领域的顶尖人士。他们以专业的视角和丰富的经验,分享了对AI技术和市场的深刻见解。期间,他们直击AI和大模型的核心技术问题,探讨了Scaling Law是否已经过时?如何构建可持续的开源生态?大模型的护城河究竟在哪里?强化学习是否会带来大模型的范式转换?DeepSeek 有意识了吗?哪些行业将会被颠覆……每一期都干货满满,在CSDN视频号矩阵吸引超50万人次观看,引发企业高管、学者、技术专家等行业人士的强烈共鸣。
Deepseek暨AI进化论十日谈主题一览:
DeepSeek技术创新及对AI生态的影响
强化学习是否会带来大模型的范式转换
直击Deepseek技术真相,对我们究竟意味着什么?
十问解读Deepseek的“国运级创新”
聊聊关于Deepseek的误区与思考
Deepseek及大模型创业生态
Deepseek与软件开发智能化
Deepseek对AI技术及开发者的刷新
从Deepseek出发聊聊意识本质和人类未来
Deepseek开启的大模型下半场战争
第一谈:DeepSeek 技术创新及对AI生态的影响
在“DeepSeek 暨AI进化论十日谈”的第一场直播中,来自 CSDN 高级副总裁李建忠深入探讨了DeepSeek的三大核心技术创新,以及它对大模型生态的深远影响。作为国产大模型的典范,DeepSeek不仅在技术上实现了突破,更通过其独特的架构设计、算法优化、工程创新推动了整个AI行业的快速发展。
DeepSeek的创新不仅改变了技术层面,还对大模型生态产生了深远影响。首先,它将大模型的成本压缩至与搜索引擎相当,降低了AI应用的门槛。随着AI应用和智能体的快速发展,多个行业,尤其是医疗、金融、零售等,将迎来智能化升级的巨大机会。
更重要的是,DeepSeek重塑了“AI铁三角”——算法、算力、数据的关系,推动了AI产业版图的重构。最后,DeepSeek的开源策略为AI创新提供了长期发展的平台,推动了全球技术共享与进步。
第二谈:强化学习是否会带来大模型的范式转换?
这一讲邀请到了CSDN高级副总裁李建忠、复旦大学教授张奇、中国人民大学高瓴人工智能学院副教授刘勇。嘉宾们首先介绍了强化学习(RL)如何在AI中发挥作用,特别是在大模型的训练中。李建忠通过AlphaGo到AlphaZero的经典案例,阐述了大模型如何通过推理能力的提升,从“快思考”到“慢思考”逐步推进。而刘勇和张奇则分别讲解了强化学习的核心框架和在大模型中的应用历史,深化了观众对RL的理解。
在讨论强化学习对大模型范式转变的影响时,嘉宾们深入剖析了大模型学习范式:模仿学习与探索学习的区别,以及如何通过强化学习实现更为高效的训练流程。特别是在DeepSeek R1的应用中,强化学习的引入不仅显著提升了推理能力,还可能减少对人工标注的依赖。通过RLHF与纯RL的对比,嘉宾们探讨了纯RL如何改变传统的监督微调方式,以及它是否意味着“人类标注师失业论”的到来。此外,嘉宾们也讨论了强化学习在加速科研工程、推动AGI发展的潜力,以及DeepSeek在这一进程中的技术贡献。
第三谈:直击Deepseek技术真相,对我们究竟意味着什么?
本期直播在CSDN&《新程序员》执行总编唐小引的主持下,邀请到三位重量级嘉宾来为我们揭示DeepSeek的技术真相:硅谷资深AI技术专家吴双,北京邮电大学人机交互与认知工程实验室主任刘伟,以及《知识增强大模型》作者、前达观数据副总裁王文广。
在本次直播中,三位专家围绕DeepSeek的技术实力展开了多维度的深入探讨。他们首先分享了对DeepSeek及其R1模型的初步印象与独特体验,进而聚焦于DeepSeek技术创新的核心本质,剖析其强大之处究竟源于算法突破还是工程优化,并深入辨析了围绕DeepSeek的诸多热点议题,例如“蒸馏”争议、低成本高效训练的实现路径、以及开源与闭源模式的优劣势。讨论还延伸至DeepSeek R1对下一代模型研究方向的潜在影响,并试图从技术、产业、生态等多个层面,解码DeepSeek现象背后所蕴含的更深层次的行业启示与未来趋势。
详细内容,欢迎阅读「直击 DeepSeek 技术真相,对我们究竟意味着什么?| 万有引力」一文。
第四谈:犀利十问,解读DeepSeek的“国运级创新”
本期CSDN高级副总裁李建忠对话北京大数医达创始人&CEO、复星集团首席AI科学家邓侃,两位AI“老炮儿”火力全开“硬核”对话,围绕十大犀利议题,分享最前沿的认知干货。
第一问:DeepSeek之后,还要不要相信Scaling Law,要不要囤卡“大力出奇迹”?
第二问:强化学习驱动的推理计算范式转移之后,数据还是否重要?
第三问:DeepSeek的赶超到底是雕虫小技?还是国运级创新?
第四问:大模型如何构建开源生态?DeepSeek会成为Linux还是Android or other?
第五问:如果DeepSeek是Android,谁是中国iOS?闭源模型是否还有机会?
第六问:大模型到底有没有护城河?如果你是梁文锋,如何建立DeepSeek的护城河?
第七问:DeepSeek首先会颠覆谁?谁最危险?谁最安全?
第八问:AGI 时代,互联网的哪些逻辑会变?哪些逻辑不会变?
第九问:DeepSeek利好哪些职业,哪些职业会更危险?
第十问:推理计算范式下,代码能力越来越强,程序员是否会大规模失业?
有关这十问的详细内容,欢迎大家前往「十道灵魂之问,十日谈解读 DeepSeek 的“国运级创新”!」阅读,本文进行了详细整理与描述。
第五谈:聊聊关于DeepSeek的十大错误认识
CSDN高级副总裁李建忠在第五谈中拨云见日,旨在厘清公众对DeepSeek的认知误区。他首先纠正了将AI发展视为线性“科技树”的片面观点,强调AI更像复杂系统,多维度协同创新才是关键,而非局限于单一技术分支或学派之争。针对 “赢家通吃,模型即产品” 的误解,李建忠强调大模型应定位为AI生态的基础设施,而非最终产品,开源共享方能促进行业繁荣。
对于“Chatbox是唯一产品形态”的误读,他指出Chatbox仅是浅层应用,大模型潜力在于赋能各行业,催生多元产品形态。关于“DeepSeek 会推翻一切”的论断,李建忠认为技术发展是进化式迭代,DeepSeek乃加速进化而非颠覆,其价值在于开辟新路径、树立新标杆。在此部分,李建忠也进一步阐释了DeepSeek的出现对“Scaling Law”的传统认知带来的挑战与反思。而将“大模型等同于操作系统”则是概念的混淆和作用的夸大,大模型是应用层技术,需与操作系统协同而非取代。
最后,针对“DeepSeek缺乏创新”的论断,李建忠有力反驳,力证DeepSeek在模型效率、成本控制及强化学习探索上的显著创新。在厘清误区后,李建忠引导思考DeepSeek是否引领AGI之路,肯定其为通往AGI的“先行者”与“探路人”,未来可期。
第六谈:DeepSeek及大模型创业生态
经过几期对DeepSeek技术和生态的剖析,我们本期将目光转向创业者,邀请到CSDN高级副总裁李建忠,维智科技创始人、PPTV前兼CEO陶闯围绕大模型创业十问展开讨论。
这十问分别是:
DeepSeek浪潮是技术奇点还是范式转变?
基础模型之后,垂直模型是否还有生存空间?
AI应用Killer App将在哪些赛道爆发?
AI应用与模型之间,中间件将呈现何种形态?
数据资产价值何在?数据、数据资产与AI的关系是什么?
时空人工智能、时空智能学、空间智能三者有何关系?
DeepSeek对具身智能行业有何影响?
AI革命是工具革命到智能革命的范式转变吗?
智能眼镜体系与时空智能有何关系?在大模型发展中将如何演进?
中国VC为何难投出DeepSeek?如何构建健康创业生态?
第七谈:DeepSeek与软件开发智能化
“DeepSeek暨AI进化论十日谈”第七讲中,CSDN高级副总裁李建忠探讨了DeepSeek如何推动软件开发智能化。他指出,DeepSeek R1的推理能力有望将软件开发带向L4高度自动编程水平(关于 L1-L5的等级划分,详见《大模型驱动软件开发的一些误区和思考》)。
李建忠剖析软件开发智能化三大核心要素:复杂性、动态性、协作性。DeepSeek R1虽擅长解决复杂性问题,但在软件开发的动态迭代与多人协作方面仍存挑战。他强调,大模型驱动软件开发并非“无代码”神话,推理能力提升使大模型从“码农”向“设计师”、“架构师”跃迁,但并非代码质量不再重要,反之,高质量代码更易于被大模型理解和优化。
针对软件开发的协作性难题,李建忠援引Titus论断——软件工程本质是多人多版本开发活动,Agent智能体是破解协作难题的关键,Agent的记忆、规划、协作三大能力将重塑软件开发模式。未来“Agent 组织者”将涌现,负责调度Agent团队,但创新性协作仍需人类主导,Agent尚不能完全取代人类在复杂协作中的核心地位。
第八谈:DeepSeek对AI技术及开发者的刷新
“DeepSeek暨AI进化论十日谈”第八讲,由 CSDN&《新程序员》执行总编唐小引主持,上海人工智能实验室青年科学家崔淦渠与中国石油大学(北京)副教授吕仲琪共同聚焦DeepSeek对开发者的意义、技术创新及未来。
专家们讨论深入DeepSeek R1模型及GRPO算法的创新性,GRPO算法在提升训练效率和降低算力成本上展现优势,验证了纯强化学习路线,尽管价值函数设计引发学术界的技术性探讨。
针对DeepSeek未获苹果的“青睐”这一热点事件,专家解读为DeepSeek侧重技术研究,商业应用非首要目标,与商业化企业定位不同。
在讨论人类在AI时代的核心竞争力时,吕仲琪将程序员分为三类:设计AI程序的程序员、创造型高级程序员以及传统码农。他认为,设计AI程序的程序员和创造型程序员在AI时代不会被取代,而传统码农则面临被AI替代的风险,需要积极提升自身技能。两位嘉宾建议积极探索AI在工作和生活中的应用,不断学习和适应AI驱动的变革。
第九谈:DeepSeek有意识吗?
“DeepSeek暨AI进化论十日谈”第九讲由CSDN创始人蒋涛主持,与复旦大学教授、高分子科学智能研究中心副主任李剑锋、科幻作家、《云球》作者白丁一同探讨“DeepSeek是否会有意识”这一前沿且深刻的议题。
讨论伊始,众嘉宾从生物学角度引入意识的起源,引发对意识与智能关系的思考:李剑锋认为,即使AI在决策、情感模拟甚至完成人类任务方面表现卓越,也并不等同于具备意识;白丁借《云球》中“意识场”的概念,呼应意识不可分割的整体性,探讨精神与意识的可分性;李建忠强调意识与死亡这一核心哲学命题紧密相连,他认为意识的核心在于主观体验,而AI虽可模仿情绪,却缺乏生命体验,尤其对死亡的感知。
在观众问答环节,嘉宾们对“AI可能加剧的贫富差距”、“产生意识的AI将优先与谁竞争”、“AI生成内容的真伪辨别与知识准确性”等十几道提问作出回答,直播间气氛活跃。尾声,嘉宾们金句频出,从“未来的小孩应该选什么专业”这一提问,引发对AI未来及人类自身价值的更深层次思考。
第十谈:DeepSeek开启的大模型下半场战争
“DeepSeek暨AI进化论十日谈”终结篇,CSDN高级副总裁李建忠深度剖析DeepSeek的出现标志着大模型竞争进入下半场,重心从预训练转向推理及应用爆发。技术成本的降低和开源生态的构建将推动AI应用迎来寒武纪般的爆发。DeepSeek目前专注于模型层,但其影响力将深入计算范式、开发范式和交互范式,尤其是在生产力工具和信息搜索领域,有望颠覆旧的互联网格局,降低创作门槛,重塑内容生产与消费的比例。
在生态层面,DeepSeek的开源技术将对云产业产生深远影响,并催生基于DeepSeek的Agent平台和云产业联盟。微信接入DeepSeek主要增强了其搜索能力,但社交领域仍然是AI最难啃的骨头。对话类AI产品的终局是Agent平台,这将重塑应用生态,独立的App或将消失,人机交互将更加自然。苹果与阿里的合作,以及操作系统厂商对Agent分发入口的争夺,都体现了AI时代新的竞争格局,而DeepSeek的未来,或将通过收购手机厂商改造操作系统,构建新一代AI Agent商店,并在国际竞争中,通过开源生态构建起强大的三层生态链。
关于AI进化论
AI进化论系列直播秉持开放、思辨、前沿的理念,邀请众多AI领域专家,带来深度、尖锐、前瞻的思想碰撞,直面AI技术挑战与机遇,一同探寻AI的无限可能,共同见证AI的蓬勃发展。
“如果说「AI进化论第一季:DeepSeek十日谈」是对技术原理的深入探索,那么现在,我们将把目光投向实践与落地!「AI进化论第二季:智能应用崛起」将聚焦DeepSeek如何赋能千行百业?智能应用如何解决实际问题,创造商业价值?等业界关注的核心话题,邀请行业先锋分享他们的经验和洞见。
进化永不终止,追问永不停歇。关注「CSDN视频号」让我们在下一次的「AI进化论」中相遇。