Powered by RND
PodcastsBusiness张小珺Jùn|商业访谈录

张小珺Jùn|商业访谈录

张小珺
张小珺Jùn|商业访谈录
Latest episode

Available Episodes

5 of 116
  • 113. 和杨植麟时隔1年的对话:K2、Agentic LLM、缸中之脑和“站在无限的开端”
    今天的嘉宾是月之暗面创始人兼CEO杨植麟,距离他上一次来我们的节目(《商业访谈录》59集)已经过去1年半。就在刚刚过去的7月,Kimi K2模型发布,引发了比较广泛的关注。K2是一个基于MoE架构的开源编程和Agentic大语言模型。形象来说,模型借助编程能力走出封闭的“缸中之脑”,长出了“手”,开始操控外部数字世界。今天这集节目我和杨植麟聊了聊K2的研发和他当下的技术认知、技术判断。以及,在过去一年的舆论风暴与创业起伏中,作为创始人,他的心情与思考。01:49 一座无限的山这有点像我最近在看的一本书:The Beginning of Infinity(无穷的开始)也许有一天会发现,这座雪山没有尽头,我希望它一直没有尽头但它还是一个“缸中之脑”:想象一个鱼缸,你把一个脑子放在里面,跟外界没有联系不管是基于长思考的强化学习,还是Agent的强化学习,都指向同一个东西:test-time scaling(测试时扩展)还有一个很有意思的趋势是,现在有更多模型公司去做“一方的Agent产品”L1到L5不一定是串行关系,Claude就bet这一点:它在Reasoning上做得不是特别多,但在Agent上做得非常好只有当模型参与到开发过程,才能解锁真正的Innovator(L4)阶段24:58 K2是乔戈里峰K2的重点有几个:一,我们希望它是一个非常好的基础模型我们希望能最大化使用每一份数据,就是所谓token efficiency——喂一样多的数据,“脑子”长得更多我们会对数据做很多Rephrase(改写)操作我们很关注Muon优化器,它对token efficiency提升很大二,我们希望K2有好的Agentic能力,对于Agentic模型来讲,最大挑战是模型的泛化它可能是一个从“缸中之脑”变成可以跟世界交互,因为所谓Agent最重要的特征是,可以多轮地使用工具人是所谓的universal constructor(万能构造器)有一种潜在思路,需要用更AI native(原生人工智能)的方式去训练AIMuon你去训的时候,它会炸54:08 既简单又复杂的系统为什么Kimi从闭源转向开源?模型训练完成,产品也基本完成了,做交互上的改进当然有价值,但那是锦上添花的一步多模态不损伤“脑子”已经很好了你可能学出来的多模态是个“傻的多模态”,我们希望它是个“聪明的多模态”Scaling Law遇到数据墙了,这是客观事实数据飞轮很依赖外部环境的feedback(反馈),我们不希望feedback有很多噪声,但现在没有把这个问题解决得非常好现在看起来,基于FLOPs的scaling是更有效路径,但这个平衡什么时候会发生变化?很多Long Context架构会影响“智商”纯粹的Linear Attention(线性注意力机制)可能影响智商,因为这个架构会有一些bias(偏差)基座模型公司和做Agent产品的应用公司,长期看边界在哪?今天怎么思考商业模式?API是好生意吗?Kimi能赚钱吗?01:25:05 在自己的故事里面Tim(周昕宇)天天跟我讲——要用RL的方式去管理,而不是用SFT用RL管理团队最大问题是,你容易被hack很多复杂性都是人为强行加上去的,实际并没有那么复杂只能说是在自己的这个故事里面——你不断地感受自己到底是什么样的一个人,你为什么要做这个事情这个问题我也问过Kimi,他说,AI是“人类文明的放大器”这也是Kimi跟我讲的——任何中间状态都有可能成为被批评的对象肯定有恐惧,更多要关注你当前这一步,能做什么?——想这个问题更重要2024年对杨植麟的访谈:《和杨植麟聊大模型创业这一年:人类理想的增量、有概率的非共识和Sora》【更多信息】文字和视频版同步上线文字版请前往公众号:语言即世界language is world视频版请前往Bilibili:张小珺商业访谈录
    --------  
    1:41:13
  • 112. 和广密聊大模型季报:分化与收敛、全家桶与垂直整合、L4体验与挖矿窗口
    在大家的强烈催更下,新一集的《全球大模型季报》终于来了。这一集有两个关键词。第一个关键词是分化。硅谷各个模型公司在这个季度,开始分化到各个领域,除了Google Gemini和OpenAI还在做通用的模型;Anthropic分化到Coding、Agentic的模型能力;Mira的Thinking Machines分化到多模态和下一代交互。第二个关键词是产品。《大模型季报》过去一直把视角放在模型的智能探索上,而广密开始浓墨重彩地聊产品,这还是第一次。这里是《全球大模型季报》的第7集,如果大家喜欢我们的系列,希望大家多多给我们一些鼓励和支持。你们的夸奖对我们来说,非常的重要。2025,期待我们和AI共同进步!03:54 模型在分化通用各项能力的模型 - Gemini/OpenAIAll in Coding+Agentic 能力 - Anthropic多模态原生 - Thinking Machines LabGrok 今天还在摸索自己生态位置Meta 原创 0-1 的基因还是很弱最领先的这几家很像 F1 竞赛21:37 横向全家桶,纵向垂直整合C端是一个非常明显的头部收敛趋势,ChatGPT可能在C端会收敛掉很多产品作为投资人或 AI 创业者,一面兴奋是技术每个月都在进步,另一面有点绝望横向全家桶的例子是ChatGPT,已经包含了Chat+搜索+Coding+Agent+WorkSpace纵向垂直整合的例子是 Gemini,从 TPU 芯片,到 Gemini 模型,到上面 Agent 应用,再到 Google 文档/Chrome浏览器/安卓操作系统/YouTube视频,可以做超级集成33:35 智能和产品都重要过去 3 年一直是对智能上限的探索极度上头,但在过去两个月开始重视产品了ChatGPT 身上有很多非技术性壁垒,而 Coding 或模型公司只是技术壁垒OpenAI 是平衡最好的一家,一边探索智能上限,一边又把智能红利转化成产品流量和品牌心智38:52 做 AI 产品很像挖矿,保鲜窗口很关键挖矿:第一个做出来让用户惊叹的体验很重要,哪怕 token 消耗很大,只要你是第一个做出来让用户惊叹的 Magic moments,就等于你起码得到了 5 亿美金的营销费用,比如 Perplexity/Cursor/Manus但这个窗口期又特别有意思,窗口是逐渐在缩短的:从 2 年、1 年、3 个月产品公司能赢过模型公司做的产品吗?44:21 L4 级别的体验最优秀的俩 Agent 都有了 L4 体验:ChatGPT 的 Deep Research + Anthropic 的 Claude Code,分别对应信息搜索+软件开发今天最大红利还是 language/code 红利,尤其是 code,还不是多模态/世界模型/机器人Claude Code 最近大杀四方,Claude Code 是一个 L4 的体验接下来还有哪些领域能有 L4 级别体验?52:43 对Google看法的转变一个猜想是,ChatGPT 后面肯定会做广告平台,因为最近招了新的商业化 CEO但我在想 Google 还是全球最好的广告平台,最后大家产品形态上都会殊途同归,融合到一起的,就是全家桶逻辑,Search 也会演变55:53 其他话题AGI有泡沫吗?假如AGI有泡沫,什么事情会是导火索,戳破泡沫?人类和大猩猩的智能水平差异在哪?最近湾区有没有什么新的讨论比较高的话题?“犹太人的金融,华人的AGI”(免责声明:本节目不构成投资建议)【全球大模型季报】系列2023年:口述全球大模型这一年:人类千亿科学豪赌与参差的中美景观2024年Q1:和广密聊AGI大基建时代:电+芯片=产出智能2024年Q2:口述全球大模型这半年:Perplexity突然火爆和尚未爆发的AI应用生态2024年Q3:AGI范式大转移:和广密预言草莓、OpenAI o1和self-play RL2024年Q4:大模型季报年终特辑:和广密预言LLM产品超越Google之路2025年Q1:大模型季报:和广密聊当下最大非共识、AGI的主线与主峰
    --------  
    1:09:11
  • 111. 李一帆口述激光雷达11年创业史:你仔细想行业的机会来自哪?是国家、民族的机会
    过去10年,中国新能源汽车产业从无到有,经历蓬勃发展。大家最熟悉的可能是理想、小鹏、蔚来这些整车品牌,但另一面这场变革背后的产业链企业也在变化。《商业访谈录》的108集对余凯和本集对禾赛联合创始人和CEO李一帆的3小时访谈,关注的都是汽车产业链上的隐形选手。这集也是李一帆对他们做激光雷达11年硬核科技创业的一部口述史。随着中国科技创新从互联网的模式创新,走向硬核科技的前沿创新,中国也许还会出现更多的技术型创业者。禾赛的故事也许能提供一个参考样本。(本次访谈录制于2025年4月)00:02:00 开始的快问快答00:02:33 股价过山车00:03:40 激光雷达99.5%的降本00:12:05 家庭和成长00:32:13 罕见的3人平分股份00:43:35 融资的伎俩00:49:02 第一笔2000万大单00:55:45 想说完蛋了…01:10:06 余凯比多我一个001:20:47 定价心思01:38:15 开始倒戈01:58:07 进入汽车大本营02:38:34 新钱和老钱03:02:16 最后的快问快答【从蒸汽机到无人驾驶】系列《对李想的3小时访谈(播客版):宅男、AI、家庭、游戏和天梯》《和何小鹏聊,FSD、“在血海游泳”、乱世中的英雄与狗熊》《对话奔驰全球CEO康林松:转型期CEO和转型之中的139岁奔驰》《余凯口述30年史:世界不止刀光剑影,是一部人来人往的江湖故事》《和楼天城聊聊Robotaxi和ACRush:“L2做得越厉害,离L4越远”》
    --------  
    3:08:32
  • 110. 逐段讲解Kimi K2报告并对照ChatGPT Agent、Qwen3-Coder等:“系统工程的力量”
    我们又来读论文啦!!!今天我们要读的论文是最近几个星期内最值得品读的几篇技术报告,分别是:Kimi K2、ChatGPT Agent、Qwen3-Coder的技术报告,以及Manus的一篇技术博文。他们的相关性是,这几篇内容都和Agent有关系。今天的嘉宾是俄亥俄州立大学(The Ohio State University)的在读博士郑博元,他的研究方向是Language Agent,他会带我们一起读上述技术报告和博文。这是《商业访谈录》的“技术之美”系列,期待和你一起读论文,领略科技平权,感受技术之美——做你的赛博组会:)00:02:00 给Agent下定义和分类00:14:50 Kimi K2、ChatGPT Agent、Qwen3-Coder、Manus的技术路线对比00:28:29 Agent Training 的关键环节:合成数据、强化学习、安全00:30:57 第一篇技术报告:Kimi K2: Open Agentic Intelligencegithub.com00:43:50 第二篇技术报告和访谈:Introducing ChatGPT agent: bridging research and actionopenai.com红杉访谈OpenAI:OpenAI Just Released ChatGPT Agent, Its Most Powerful Agent Yetwww.sequoiacap.com01:53:38 第三篇技术报告:Qwen3-Coder: Agentic Coding in the Worldqwenlm.github.io01:59:04 第四篇技术博文:AI代理的上下文工程:构建Manus的经验教训(作者:Yichao 'Peak' Ji)manus.im02:06:06 展望:也许会有一个新的范式02:15:20 我感觉Agent是“我拓展的大脑”,我背后有一个“军团”(Family of Agents)02:16:41 不同Bot的语言风格:DeepSeek嘴臭,元宝舔狗智能体定义Agent是一种能够与环境进行交互(interaction)的智能系统。它具备两个基本能力:感知能力(Perception)能够观察环境的状态,包括获取外部信息、读取反馈信号、解析上下文等。行动能力(Action)能够在环境中执行动作,例如调用工具、生成输出、控制界面、修改变量等。简言之,Agent = 感知 + 行动在一个循环中不断执行“观察 → 决策 → 行动”的流程,以达成任务目标。Agent 的定义与分类1. Coding Agent(代码智能体)代表产品:Cursor、Windsurf特点:代码生成与编辑能力强,用户体验优秀应用场景:代码补全、代码重构、多人协作编程2. Search Agent(搜索型智能体)特点:结合搜索引擎,自动完成信息检索和汇总应用场景:市场调研、报告生成、竞争对手分析等潜力:在企业级场景中有很强的应用价值3. Tool-Use Agent(工具使用型智能体)特点:能够调用多种外部工具完成复杂任务应用重点:是目前 Agent 研究和落地的主要方向举例:ReAct(推理 + 行动)类 Agent,通过 tool calling 执行任务4. Computer Use Agent(电脑操作型智能体)代表产品:OpenAI Operator、Claude 的 Computer Use特点:模拟人类使用电脑,完成跨应用的复杂操作应用场景:执行流程自动化、远程助理、办公代理Agent 的技术路线对比1. In-Context Learning(上下文学习)特点:依赖强大的预训练模型,通过提示构造实现任务规划与执行优势:无需微调,灵活性高局限:泛化能力弱,rollout 长度有限,容易失控2. End-to-End Training(端到端训练)特点:将 Agent 的全部行为编码进模型权重优势:推理稳定,可控性强局限:训练成本高,环境构建复杂Agent Training 的关键环节1. Data Synthesis(数据合成)方法:生成大量高质量的 trajectory(行动轨迹)用途:训练 Agent 在任务中如何决策、调用工具、管理 memory(记忆)2. Reinforcement Learning(强化学习)条件:需要定义清晰的 task(任务)与 verifiable reward(可验证奖励)挑战:任务难度与环境反馈设计直接影响 Agent 的行为质量3. Safety(安全性)问题风险:Agent 具备自主决策能力,容易误用工具、走偏轨迹对策:加入 sandbox(沙盒)限制、行为约束机制、Human-in-the-loop(人类监控)展望:也许会有一个新的范式生成数据的核心会从 input-output 式的数据标注,转向构建 environment(环境)以及对应的 task-reward(任务-奖励)。比如 Scale AI 提出的 rubrics as reward(用评分标准作为奖励机制)Agent 能不能实现自我提升(self-improve)?一方面,Agent 在和环境交互的过程中会不断获得新数据;那它能不能自己找到或构造 verifiable reward(可验证的奖励)?交互中积累的 experience(经验),能不能被更有效地利用起来?
    --------  
    2:20:45
  • 109. 机器人遭遇数据荒?与谢晨聊:仿真与合成数据、Meta天价收购和Alexandr Wang
    今天又是一集机器人专场。嘉宾是光轮智能创始人兼CEO谢晨,他曾在英伟达、Cruise及蔚来汽车担任自动驾驶仿真负责人。我们的话题非常具体,即:仿真与合成数据。今天的具身智能尚且没有找到scaling law的有效配方,其中,数据是一个关键卡点。我们106集的嘉宾银河通用创始人王鹤就提到,真实数据在他们的训练数据比重仅仅1%,合成数据挑起大梁。今天这集节目,我与谢晨聊了聊仿真与合成数据的实操细节。02:00 开始的快问快答02:48 高频词汇解析:Sim2Real(从仿真到现实)、Sim2Real的gap、合成数据04:31 从Cruise到英伟达到蔚来,怎么做合成数据和仿真?14:11 制作合成数据的具体流程?合成数据与真实数据的配比?16:17 在合成数据上,智能驾驶和具身智能的区别(智能驾驶是视觉的游戏,具身智能的物理交互最关键)32:41 物理的Real2Sim(真实到仿真)工作流是怎样的?怎么评估成功的仿真?关键技术节点?46:18 Physical Intelligence(π)对仿真与合成数据的两难态度48:55 辣评Meta 300亿美金收购Scale AI和极其aggressive的Alexandr Wang53:57 合成数据目前面临的瓶颈55:25 全球具身智能产业链Mapping:硬件公司(宇树)基座模型公司(π、Skild、英伟达和DeepMind)在垂域落地的软硬结合公司(Figure,特斯拉Optimas、The Bot Company)以仿真为中心做端到端落地的公司(光轮)(“特斯拉Optimas的管理文化和π完全不一样”)01:09:22 美国存在具身模型层的创业机会,中国在我看来字节、小米、理想更适合做“大脑”01:15:33 老黄在内部说:NV is a simulation company01:21:25 终局的模型应该是是跨宇宙、跨世界、跨本体(提升跨宇宙的能力,本质是提升泛化性)01:23:28 具身智能的产业还在GPT-1阶段,还没找到scaling law的配方01:28:21 我创业刚开始,从具身的本科开始学起01:37:37 最后的快问快答【机器人专场】逐篇讲解机器人基座模型和VLA经典论文——“人就是最智能的VLA”和王鹤聊,具身智能的学术边缘史和资本轰炸后的人为乱象
    --------  
    1:41:09

More Business podcasts

About 张小珺Jùn|商业访谈录

努力做中国最优质的科技、商业访谈。 张小珺:财经作者,写作中国商业深度报道,范围包括AI、科技巨头、风险投资和知名人物,也是播客《张小珺Jùn | 商业访谈录》制作人。 如果我的访谈能陪你走一段孤独的未知的路,也许有一天可以离目的地更近一点,我就很温暖:)
Podcast website

Listen to 张小珺Jùn|商业访谈录, Working Hard with Grace Beverley and many other podcasts from around the world with the radio.net app

Get the free radio.net app

  • Stations and podcasts to bookmark
  • Stream via Wi-Fi or Bluetooth
  • Supports Carplay & Android Auto
  • Many other app features
Social
v7.23.3 | © 2007-2025 radio.de GmbH
Generated: 8/28/2025 - 12:02:33 AM