42章经

Épisodes disponibles

5 sur 40

Agent 开发的上半场: 环境、Tools 和 Context 如何决定 Agent｜对谈 Sheet0 创始人王文锋
活动预告🥳：4 月 26 日，我们会请到 sheet0.com 创始人文锋做一场线下活动，大家记得翻到 shownotes 末尾查看报名信息！关于 Agent 这个话题，我自己有一些核心在思考的问题，相信这些也是很多人同样会有疑问的地方，这期播客中我们就这些问题展开了讨论，并基本得到了一些答案：1）怎么定义 Agent，Agent 最重要的是什么2）今天的 Agent 和两年前的 Agent 的区别是什么3）如何简单快速理解 Function Call，Coding Agent，MCP，A2A，Computer Use，Browser Use 等概念4）不同方式的区别是什么，有什么优劣之分吗5）怎么看通用 Agent 和垂直 Agent 的区别，终局是什么6）AI Coding 和 Agent 最终会是一件事吗，或者二者会有什么关联7）Workflow 和 Agent 的区别和终局8）RL 这件事在 Agent 里的重要程度是什么，一家公司（尤其是做 Agent 的创业公司）到底该如何使用 RL9）大模型自身的 Agent 比如 OpenAI Operator 和其他应用产品的区别是什么，最终市场形态会怎样10）如何快速判断一家 Agent 公司做得好不好另外，在整段讨论中，本期嘉宾文锋基于长时间对 Agent 的研究和实操，还提出了很多理解和分析 Agent 的框架和关键要素，以及在接近结尾部分留下了让我非常有启发的一句话：AI Coding 是大模型的灵巧手。【人类博物馆】导游：曲凯，42章经创始人33 号珍藏：王文锋，Agent builder，sheet0.com Founder & CEO，连续创业者，有近十年 AI、Data Infra 产品设计和 Coding 经验。sheet0.com 已开放 waiting list 申请，即将内测。【时光机】 00:47 Agent 三要素：LLM、Context、Tool Use 1:17 这波 Agent 和过去两年的区别是什么？ 2:30 怎么理解 Agent 中的 Context？ 4:21 快速理解 Tool Use 的不同方案 4:40 代码调用支线：Function Call、MCP、A2A 之间的区别是什么？ 6:35 模拟人类支线：浏览器是大模型能调用的最重要的工具 7:07 两条支线各有优缺点，也可以混合起来 10:27 Manus、Devin、Genspark 各用的什么方案？ 12:25 Browser Use 的核心价值是给用户提供「安全感」 14:19 AI Coding 和 Agent 最终会殊途同归吗？ 16:15 Agent 的终局会走向通用还是垂直？ 17:17 脱离了 RL，Agent 就不成立了 19:15 所以 Agent 创业公司该如何使用 RL？ 22:54 一个非共识理解：聊天框 + 场景推荐 UI 界面就是最好的交互形态 31:54 Sheet0 是一个怎样的 Agent 产品？ 34:15 怎么把任务执行的准确率做到了 100%？ 35:39 Workflow 会被 Agent 颠覆掉吗？ 36:49 不同 Agent 的核心区别是什么？ 39:05 AI Coding 是大模型的「灵巧手」 41:41 Agent 有两大「信任」命题 44:22 分享一个预测 Agent 未来发展的思考框架 47:33 如何快速判断一家 Agent 公司做得好不好？【Reference】文锋推荐大家都读一读强化学习之父 Richard Sutton 的《Reinforcement Learning：An Introduction》【活动预告🥳】4 月 26 日，我们会请到文锋做一场线下活动，感兴趣的朋友欢迎点击链接或扫描下面的二维码，一起来认识&交流！【The gang that made this happen】制作人：陈皮、Celia 剪辑：陈皮 Bgm：Mondo Bongo - Joe Strummer & The Mescaleros
--------
52:38
一堂「强化学习」大师课｜对谈清华叉院助理教授吴翼
当 AI 预训练的 scaling law 开始放缓，强化学习 (RL) 接过接力棒，拉出了一条漂亮的第二曲线。在当下的 Agent 热里，有 RL 能力的团队，也是最被看好和押注的。但很多人对 RL 都没有一个足够清晰的理解，包括我自己。所以这期我们请到了国内 RL 领域的专家、清华大学交叉信息研究院助理教授吴翼，来讲讲 RL 的原理到底是啥、RL+LLM 的路径是怎么发展起来的、目前存在哪些非共识、未来还会怎么演变等等（聊完感觉像上了一堂免费大师课）。而且聊着聊着，我们发现，人生就是一个 RL 的过程，区别是 RL 有明确的奖励函数，但是人生没有。可能如吴翼教授所说，我们首先都要以一种「最大熵」的方式去主动和不确定的世界交互，才能找到自己的奖励函数，优化自己的人生曲线。最后，吴翼教授的团队最近开源了一个 RL 框架 AReaL-boba，在 SOTA 7B 上跑出了 AIME24 61.9 的分数，也欢迎大家去 GitHub 关注。【人类博物馆】导游：曲凯，42章经创始人32 号珍藏：吴翼，清华大学交叉信息研究院助理教授，前 OpenAI 研究员。【时光机】 1:51 到底什么是 RL？ 4:25 人生就是一个强化学习的过程 6:22 RL 和 LLM 是怎么结合起来的？ 7:01 强强联手第一步：InstructGPT，实现指令遵从 10:07 过程中衍生出了 RLHF 11:41「慢思考」的需求催生了 RL 的应用 16:10 为什么说 Anthropic RL 做得特别好？ 21:17 行业对 RL+LLM 的最优路径形成共识了吗？ 25:11 RL 起来之后，对 Agent 的影响是什么？ 32:11 Intelligence = LLM (理解) × RL (决策)，二者缺一不可 34:14 Scaling law 的未来 34:33 Pretraining 的两个发展方向 36:43 RL 还处于早期，进入深水区后可能会走向分化 40:02 大模型团队的组织架构要如何设计？ 43:21 一个反常识：对 AI 来说，理解比生成更难，token 消耗更大 47:38 现在做 Agent 一定需要一个懂 RL 的人吗？ 49:32 为什么 RL 人才这么稀缺？ 56:10 RL 目前三大分支：泛化 (DeepSeek)、代码 (Anthropic)、Agent (OpenAI) 58:55 框架对 RL 意味着什么？ 1:02:51 RL 在海内外进展还有明显差距 1:04:42 想做好 RL，基建≫数据＞算法 1:06:05 研究 RL 收获的一些人生启发【Reference】吴翼的 PhD 毕业论文：On Building Generalizable Learning Agents 吴翼获机器学习顶级会议 NIPS2016 最佳论文奖的论文： Value Iteration Network 吴翼提到的他非常喜欢的有关 Diversity-Driven RL 的两篇论文：Iteratively Learn Diverse Strategies with State Distance Information、Discovering Diverse Multi-Agent Strategic Behavior via Reward Randomization 吴翼团队和蚂蚁研究院开源的强化学习训练框架：AReaL-boba【The gang that made this happen】制作人：陈皮、Celia 剪辑：陈皮 Bgm：Mondo Bongo - Joe Strummer & The Mescaleros
--------
1:12:49
世界怎么就「东升西落」了？聊聊二级市场与 DeepSeek+Manus 的热潮｜对谈莫傑麟
我又来美国了。这次来，我发现市场真的变化太快，这边很多人都开始相信一个所谓「东升西落」的叙事。于是我再次请来了莫傑麟，和他聊聊二级市场自 DeepSeek 发布以来有哪些新变化、新趋势。在这期播客里，我们推演了「东升西落」的演绎过程和底层逻辑，谈了我们各自对 DeepSeek 和 Manus 这两个热门产品的感受，也聊了宏观的市场环境和股市的未来。最近两年很多人都在说，这波 AI 中的最赚钱的方式是炒股。但真的是这样吗？二级市场真的才是大家最终的归宿吗？【人类博物馆】导游：曲凯，42章经创始人九号珍藏：莫傑麟，家族办公室资深从业者【时光机】Part1 「东升西落」的叙事 00:30 为什么二级市场突然流行「东升西落」的叙事？ 1:00 推演一下演绎过程和底层逻辑 5:19 之前大家过于低估国内 AI 了 6:47 中美对 AI 的叙事重点完全不同 7:27 简评 DeepSeek 9:48 简评 Manus 10:15 Manus 是最典型的中国式 AI 产品 11:58 Manus 爆火背后的两个核心原因 14:35 为什么后来风评急转直下？ 16:01 未来的 AI 产品可能要先在海外宣发，再杀回国内 Part2 二级市场的宏观环境 22:04 二级市场 = 预期 + 趋势 23:12 关于预期——大家对中国的预期是什么？ 24:39 为什么阿里加大对 AI 的 Capex 投入后，股价大涨？ 26:17 腾讯是 DeepSeek 这波的最大受益者 31:11 25 年的中国在重演 23-24 年的美国 33:48 芯片「卡脖子」还会是问题吗？ 35:42 关于趋势 35:52 暗线 (宏观环境)：稳中向好 37:30 明线 (产业趋势)：AI+专精特新+消费多点开花 Part3 股市的未来 38:44 今年 A 股会不会继续涨，美股会不会继续跌？ 41:13 二级市场在变得越来越卷，共识的达成和演绎速度越来越快 43:57 这波 AI 最赚钱的方式真的是炒股吗？ 46:44「大起大落的高频波动」可能是未来股市的常态 48:14「做时间的朋友」还行得通吗？ 49:54 分享一些 25 年的个人观察 50:18 AI 领域我会重点关注三个问题 52:53 很多非 AI 公司也很值得研究 54:56 二级市场是所有人的最终归宿吗？【Reference】为什么我们开始乐观？关于经济发展的明线暗线、AI 与最佳实践 | 对谈莫傑麟【The gang that made this happen】制作人：陈皮、Celia 剪辑：陈皮 Bgm：Mondo Bongo - Joe Strummer & The Mescaleros
--------
56:18
信念感与硅谷顶尖孵化器的奇遇：赴美三月，实现千万刀 ARR｜对谈 ACE Studio 创始人 Joe
如果有人问你，给你三个月的时间，你能把目前手上负责的业务数据翻十倍吗？相信大多数人都会觉得这是痴人说梦，但这件事 ACE Studio 做到了。而他们做到的原因不是他们本来就能，而是有人让他们相信了这件事。这就是我们今天要讲的故事，这就是信念感这三个字的力量。去年 5 月份我们做过一期 PMF 主题的节目，ACE Studio 的创始人 Joe 聊了很多他们的产品是如何在美国市场找到 PMF 的。当时他们刚刚开启付费半年，就已经做到了很不错的月收入。这次我们又把他请来，是因为才刚过去了大半年，他们的收入竟然就增长了 10 倍，已经成功跻身千万美金 ARR 第一梯队。能做到这点，是因为他们去了硅谷一家很有名的孵化器 HF0，并在那边搞了 3 个月的封闭式开发。这期播客中，Joe 就毫无保留地分享了 HF0 到底是怎么奏效的、他们在 HF0 的实际体验与收获，和实现 10 倍增长的具体经验（比如他们是怎么一招就让公司一夜之间收入翻倍的？）。如果你对 Joe 的参加孵化器的经验，或者对去美国参加类似的组织感兴趣，可以添加我的微信 qukai42，42章经今年也会组织更多中美连接的活动和事情，欢迎你用各种方式加入进来。【人类博物馆】导游：曲凯，42章经创始人20 号珍藏：Joe，ACE Studio 创始人。ACE Studio 是一款面向专业音乐制作人和创作者的 AI 音乐工作站，致力于用 AI 重新定义音乐创作，自 2023 年 10 月上线以来发展迅猛，月收入已达 80 万美金。【时光机】Part1 HF0 为什么有效 01:23 先回顾下入选这家美国知名孵化器的过程 03:48 英语不好会是阻力吗？ 05:34 3000 进 10 的概率下，HF0 为什么选中了你们？ 07:19 HF0 和其它孵化器不太一样 08:46 HF0 没教我们怎么做业务，这事也不该别人来教 10:35 最关键的第一步：HF0 给我们注入了「一定能猛涨」的信念感 12:23 这种信念感很难自我激发 14:23 开营后，HF0 营造了一个专注于增长的氛围 16:25 最大的压力和最深的恐惧就是「别丢脸」… 17:44 这种氛围本质上改变了我想问题的方式 19:17 也让我们涌起了「别让大家觉得华人不行」的责任感 21:38 一直 build「憋大招」可能并不成立 22:40 从 HF0 出来后，还能保持在其中的状态吗？ 23:55 我们马上要复刻 HF0 的体验 Part2 3 个月涨 10 倍的具体实践 26:50 五周过去都没怎么增长的时候，信念感崩塌了吗？ 27:43 绝境逢生的戏剧化转折：我们试了一招，第二天日收入直接 double 28:51 Quora 创始人教会了我们一种思考方法 30:00 之前没想到这么干，是因为我们没悟到一件事 31:18 要问这招是啥？——答案乍一听可能有点搞笑哈 31:29 但搞笑背后是一种硅谷的方法论 32:57 在硅谷的几个经历也启发了我们 33:53 后面我们还试了很多招数，最终达成了 10 倍的增长 34:01 我们在价格模型上做了很多文章 34:24 Blake Anderson（千万美金 ARR 产品 Cal AI 的创始人）让我意识到，我们之前联系 influencer 的方式都不对 36:33 我们把付费广告的 ROI 提高到了 2 倍 36:59 产品功能升级和老用户也没落下 37:30 但前六周的苦工是省不掉的Part3 一些观察 39:02 美国投资人的工作方式和提的问题有什么不同？ 40:31 美国机构真的很不喜欢中国团队吗？ 42:51 肉身到硅谷去很重要 43:12 我越来越坚信，AI 产品化大有可为 44:44 Perplexity 的 pitch deck 上有两句话，合起来看很妙 45:13 我的壁垒就是我的「人日」 46:47 硅谷的做事风格越来越回归本质了【Reference】 ACE Studio 产品界面关于 HF0：HF0 是由 Dave Fontenot（世界上最大的黑客松 MHacks 创始人）、Evan Stites- Clayton 和 Emily Liu 共同创立的常驻创业孵化器，有着严苛的筛选标准，由包括 Marc Andreessen、Chris Dixon 在内的多位知名投资者支持，创办第一年就孵化出了 3 家独角兽公司，也孵化过包括 ComfyUI、Story.com 等在内的多家优秀的 AI 公司。【The gang that made this happen】制作人：陈皮、Celia 剪辑：陈皮 Bgm：Mondo Bongo - Joe Strummer & The Mescaleros
--------
48:32
第一个出 ICU 的 AI 创业者｜对谈心影随形 CEO Binson
Binson literally 进了 ICU，一场严重的车祸让他对这个世界和创业这件事有了不同的认识。这期播客中我们先聊了他的这场车祸，和他是如何度过在 ICU 的六个日夜的，相信这种经历是绝大多数人没有机会尝试甚至是听说的，而 Binson 恢复了四个月后已经可以比较正常地坐在我的对面回顾这段经历，他讲了在这个过程中他心态的一些变化，以及在事故之后他是如何改变他对待人生和经营公司的方式的。Binson 在此之前是知名的大厂高管，他从百度副总监、360 助理总裁，一路做到了 bilibili 副总裁，所以我们也聊了他打工和换工作的很多经验，以及就是他为什么创业，现在又是如何看待 AI 和自己的心影随形（逗逗游戏伙伴）这个公司和产品的。最后，我们的 AI 私董会也在持续报名中，目前已经聚集了一批市场上最好的 AI 创始人，欢迎点击链接报名（里面也有目前已加入的成员名单，可点击查看）【人类博物馆】导游：曲凯，42章经创始人31 号珍藏：Binson，心影随形 CEO。心影随形成立至今已获得多轮融资。逗逗游戏伙伴是其推出的一款陪用户玩游戏的 AI 桌宠软件，已有 600 万的用户规模。此前，Binson 曾先后担任百度副总监、360 助理总裁、bilibili 副总裁等职位。【时光机】Part1 车祸后的感悟 1:52 我是怎么差点挂了的？ 2:19 死里逃生的过程 7:56 更痛苦的是躺进 ICU 后的精神煎熬 12:01 我们活着的意义到底是啥？ 13:58 这件事教会了我「停下来」和「放手」的重要性 17:35 我创业的心态和行动有些具体的变化Part2 大厂打工 V.S. 创业的体悟 22:38 如果真的只为了赚钱，不要创业 23:04 复盘三段大厂经历 23:20 我应该更早离开百度 25:09 为什么不应该为了两三倍工资而跳槽？ 27:15 为什么 20 年我选择去 B 站，而不是字节、快手、拼多多或者小红书？ 29:43 原本没想去 360，但周鸿祎给了我一个新的视角 35:12 作为一个如此有创业精神的人，为什么没有更早出来？ 37:33 创业首先要摒弃大厂思维 42:46 创业总是焦虑？多半是因为事先思考得不够充分 44:42 不要回避大厂竞争的问题 45:25 创业最难的是招人和统一大家的思路 46:22 成长最快的是工作两三年的 47:31「有爱」可以后天培养吗？ 47:57 一个残酷的现实是，大厂已经不育人了 49:13 分享一个有效训练决策能力的方法Part3 聊聊 AI 51:12 桌宠形态产品的留存高是一个值得炫耀的事么？ 52:06 为什么逗逗游戏伙伴很难被 copy？ 53:46 一些 AI 观察 54:10 今年会陆续有一批 AI 公司被淘汰 55:08 LLM 的进展超出预期，多模态则不及预期 55:53 Chatbot 这种模式可能就不对 56:17 我们不看对话轮数、不看留存、不看时长 58:49 一个值得思考的未来方向【Reference】 Binson 交通事故的完整经历和更多感悟，可以看他之前写的公众号mp.weixin.qq.com 逗逗游戏伙伴桌宠形态的示意图：逗逗游戏伙伴陪玩《黑神话：悟空》的示意视频【The gang that made this happen】制作人：陈皮、Celia 剪辑：陈皮 Bgm：Mondo Bongo - Joe Strummer & The Mescalero
--------
1:03:10

Plus de podcasts Technologies

Podcasts tendance de Technologies

À propos de 42章经

你好，我是曲凯，42章经的创始人。小的时候我不太舍得花钱，记得当年一毛钱一袋的牛肉干真的很好吃，但如果偶尔遇到一个很有趣的人，我会欣然花几十、上百块请他吃个饭，还觉得自己赚到了。后来长大了一些，开始刷人人网、豆瓣、知乎、再到现在的即刻…… 你有没有偶尔在这些平台刷到过一个很有缘的人，然后在一个夏日的午后，把他的发言、转载和收藏全都看了一遍，并觉得心有戚戚焉。再后来工作和创业以后，每天就是聊各种各样的投资人、创业者。如果能聊到一个优秀的人，真的会有一种如沐春风的感觉，并真心觉得很幸福。而同行们见面经常会聊到的问题也是：最近有没有遇到什么有意思的人？所以，这个播客就是要努力把这些人带到你的身边。我们只专注和有趣、有独到认知、又愿意坦诚分享的聪明人聊天。希望你听完每一期都能回到小时候，回到那个因为认识了有趣的人、收获了新知，而感到单纯美好幸福的时刻。如果听完以后，你还能暗自感慨一句， “我也好想认识这个人啊。” 或者， “哇靠，有被启发到。” 那这个播客也就值了。

Site web du podcast

Technologies