Powered by RND

42章经

KaiQu
42章经
Dernier épisode

Épisodes disponibles

5 sur 40
  • Agent 开发的上半场: 环境、Tools 和 Context 如何决定 Agent|对谈 Sheet0 创始人王文锋
    活动预告🥳:4 月 26 日,我们会请到 sheet0.com 创始人文锋做一场线下活动,大家记得翻到 shownotes 末尾查看报名信息!关于 Agent 这个话题,我自己有一些核心在思考的问题,相信这些也是很多人同样会有疑问的地方,这期播客中我们就这些问题展开了讨论,并基本得到了一些答案:1)怎么定义 Agent,Agent 最重要的是什么2)今天的 Agent 和两年前的 Agent 的区别是什么3)如何简单快速理解 Function Call,Coding Agent,MCP,A2A,Computer Use,Browser Use 等概念4)不同方式的区别是什么,有什么优劣之分吗5)怎么看通用 Agent 和垂直 Agent 的区别,终局是什么6)AI Coding 和 Agent 最终会是一件事吗,或者二者会有什么关联7)Workflow 和 Agent 的区别和终局8)RL 这件事在 Agent 里的重要程度是什么,一家公司(尤其是做 Agent 的创业公司)到底该如何使用 RL9)大模型自身的 Agent 比如 OpenAI Operator 和其他应用产品的区别是什么,最终市场形态会怎样10)如何快速判断一家 Agent 公司做得好不好另外,在整段讨论中,本期嘉宾文锋基于长时间对 Agent 的研究和实操,还提出了很多理解和分析 Agent 的框架和关键要素,以及在接近结尾部分留下了让我非常有启发的一句话:AI Coding 是大模型的灵巧手。【人类博物馆】导游:曲凯,42章经创始人33 号珍藏:王文锋,Agent builder,sheet0.com Founder & CEO,连续创业者,有近十年 AI、Data Infra 产品设计和 Coding 经验。sheet0.com 已开放 waiting list 申请,即将内测。【时光机】 00:47 Agent 三要素:LLM、Context、Tool Use 1:17 这波 Agent 和过去两年的区别是什么? 2:30 怎么理解 Agent 中的 Context? 4:21 快速理解 Tool Use 的不同方案 4:40 代码调用支线:Function Call、MCP、A2A 之间的区别是什么? 6:35 模拟人类支线:浏览器是大模型能调用的最重要的工具 7:07 两条支线各有优缺点,也可以混合起来 10:27 Manus、Devin、Genspark 各用的什么方案? 12:25 Browser Use 的核心价值是给用户提供「安全感」 14:19 AI Coding 和 Agent 最终会殊途同归吗? 16:15 Agent 的终局会走向通用还是垂直? 17:17 脱离了 RL,Agent 就不成立了 19:15 所以 Agent 创业公司该如何使用 RL? 22:54 一个非共识理解:聊天框 + 场景推荐 UI 界面就是最好的交互形态 31:54 Sheet0 是一个怎样的 Agent 产品? 34:15 怎么把任务执行的准确率做到了 100%? 35:39 Workflow 会被 Agent 颠覆掉吗? 36:49 不同 Agent 的核心区别是什么? 39:05 AI Coding 是大模型的「灵巧手」 41:41 Agent 有两大「信任」命题 44:22 分享一个预测 Agent 未来发展的思考框架 47:33 如何快速判断一家 Agent 公司做得好不好?【Reference】文锋推荐大家都读一读强化学习之父 Richard Sutton 的《Reinforcement Learning:An Introduction》【活动预告🥳】4 月 26 日,我们会请到文锋做一场线下活动,感兴趣的朋友欢迎点击链接或扫描下面的二维码,一起来认识&交流!【The gang that made this happen】 制作人:陈皮、Celia 剪辑:陈皮 Bgm:Mondo Bongo - Joe Strummer & The Mescaleros
    --------  
    52:38
  • 一堂「强化学习」大师课|对谈清华叉院助理教授吴翼
    当 AI 预训练的 scaling law 开始放缓,强化学习 (RL) 接过接力棒,拉出了一条漂亮的第二曲线。在当下的 Agent 热里,有 RL 能力的团队,也是最被看好和押注的。但很多人对 RL 都没有一个足够清晰的理解,包括我自己。所以这期我们请到了国内 RL 领域的专家、清华大学交叉信息研究院助理教授吴翼,来讲讲 RL 的原理到底是啥、RL+LLM 的路径是怎么发展起来的、目前存在哪些非共识、未来还会怎么演变等等(聊完感觉像上了一堂免费大师课)。而且聊着聊着,我们发现,人生就是一个 RL 的过程,区别是 RL 有明确的奖励函数,但是人生没有。可能如吴翼教授所说,我们首先都要以一种「最大熵」的方式去主动和不确定的世界交互,才能找到自己的奖励函数,优化自己的人生曲线。最后,吴翼教授的团队最近开源了一个 RL 框架 AReaL-boba,在 SOTA 7B 上跑出了 AIME24 61.9 的分数,也欢迎大家去 GitHub 关注。【人类博物馆】导游:曲凯,42章经创始人32 号珍藏:吴翼,清华大学交叉信息研究院助理教授,前 OpenAI 研究员。【时光机】 1:51 到底什么是 RL? 4:25 人生就是一个强化学习的过程 6:22 RL 和 LLM 是怎么结合起来的? 7:01 强强联手第一步:InstructGPT,实现指令遵从 10:07 过程中衍生出了 RLHF 11:41「慢思考」的需求催生了 RL 的应用 16:10 为什么说 Anthropic RL 做得特别好? 21:17 行业对 RL+LLM 的最优路径形成共识了吗? 25:11 RL 起来之后,对 Agent 的影响是什么? 32:11 Intelligence = LLM (理解) × RL (决策),二者缺一不可 34:14 Scaling law 的未来 34:33 Pretraining 的两个发展方向 36:43 RL 还处于早期,进入深水区后可能会走向分化 40:02 大模型团队的组织架构要如何设计? 43:21 一个反常识:对 AI 来说,理解比生成更难,token 消耗更大 47:38 现在做 Agent 一定需要一个懂 RL 的人吗? 49:32 为什么 RL 人才这么稀缺? 56:10 RL 目前三大分支:泛化 (DeepSeek)、代码 (Anthropic)、Agent (OpenAI) 58:55 框架对 RL 意味着什么? 1:02:51 RL 在海内外进展还有明显差距 1:04:42 想做好 RL,基建≫数据>算法 1:06:05 研究 RL 收获的一些人生启发【Reference】 吴翼的 PhD 毕业论文:On Building Generalizable Learning Agents 吴翼获机器学习顶级会议 NIPS2016 最佳论文奖的论文: Value Iteration Network 吴翼提到的他非常喜欢的有关 Diversity-Driven RL 的两篇论文:Iteratively Learn Diverse Strategies with State Distance Information、Discovering Diverse Multi-Agent Strategic Behavior via Reward Randomization 吴翼团队和蚂蚁研究院开源的强化学习训练框架:AReaL-boba【The gang that made this happen】 制作人:陈皮、Celia 剪辑:陈皮 Bgm:Mondo Bongo - Joe Strummer & The Mescaleros
    --------  
    1:12:49
  • 世界怎么就「东升西落」了?聊聊二级市场与 DeepSeek+Manus 的热潮|对谈莫傑麟
    我又来美国了。这次来,我发现市场真的变化太快,这边很多人都开始相信一个所谓「东升西落」的叙事。于是我再次请来了莫傑麟,和他聊聊二级市场自 DeepSeek 发布以来有哪些新变化、新趋势。在这期播客里,我们推演了「东升西落」的演绎过程和底层逻辑,谈了我们各自对 DeepSeek 和 Manus 这两个热门产品的感受,也聊了宏观的市场环境和股市的未来。最近两年很多人都在说,这波 AI 中的最赚钱的方式是炒股。但真的是这样吗?二级市场真的才是大家最终的归宿吗?【人类博物馆】导游:曲凯,42章经创始人九号珍藏:莫傑麟,家族办公室资深从业者【时光机】Part1 「东升西落」的叙事 00:30 为什么二级市场突然流行「东升西落」的叙事? 1:00 推演一下演绎过程和底层逻辑 5:19 之前大家过于低估国内 AI 了 6:47 中美对 AI 的叙事重点完全不同 7:27 简评 DeepSeek 9:48 简评 Manus 10:15 Manus 是最典型的中国式 AI 产品 11:58 Manus 爆火背后的两个核心原因 14:35 为什么后来风评急转直下? 16:01 未来的 AI 产品可能要先在海外宣发,再杀回国内 Part2 二级市场的宏观环境 22:04 二级市场 = 预期 + 趋势 23:12 关于预期——大家对中国的预期是什么? 24:39 为什么阿里加大对 AI 的 Capex 投入后,股价大涨? 26:17 腾讯是 DeepSeek 这波的最大受益者 31:11 25 年的中国在重演 23-24 年的美国 33:48 芯片「卡脖子」还会是问题吗? 35:42 关于趋势 35:52 暗线 (宏观环境):稳中向好 37:30 明线 (产业趋势):AI+专精特新+消费多点开花 Part3 股市的未来 38:44 今年 A 股会不会继续涨,美股会不会继续跌? 41:13 二级市场在变得越来越卷,共识的达成和演绎速度越来越快 43:57 这波 AI 最赚钱的方式真的是炒股吗? 46:44「大起大落的高频波动」可能是未来股市的常态 48:14「做时间的朋友」还行得通吗? 49:54 分享一些 25 年的个人观察 50:18 AI 领域我会重点关注三个问题 52:53 很多非 AI 公司也很值得研究 54:56 二级市场是所有人的最终归宿吗?【Reference】为什么我们开始乐观?关于经济发展的明线暗线、AI 与最佳实践 | 对谈莫傑麟【The gang that made this happen】 制作人:陈皮、Celia 剪辑:陈皮 Bgm:Mondo Bongo - Joe Strummer & The Mescaleros
    --------  
    56:18
  • 信念感与硅谷顶尖孵化器的奇遇:赴美三月,实现千万刀 ARR|对谈 ACE Studio 创始人 Joe
    如果有人问你,给你三个月的时间,你能把目前手上负责的业务数据翻十倍吗?相信大多数人都会觉得这是痴人说梦,但这件事 ACE Studio 做到了。而他们做到的原因不是他们本来就能,而是有人让他们相信了这件事。这就是我们今天要讲的故事,这就是信念感这三个字的力量。去年 5 月份我们做过一期 PMF 主题的节目,ACE Studio 的创始人 Joe 聊了很多他们的产品是如何在美国市场找到 PMF 的。当时他们刚刚开启付费半年,就已经做到了很不错的月收入。这次我们又把他请来,是因为才刚过去了大半年,他们的收入竟然就增长了 10 倍,已经成功跻身千万美金 ARR 第一梯队。能做到这点,是因为他们去了硅谷一家很有名的孵化器 HF0,并在那边搞了 3 个月的封闭式开发。这期播客中,Joe 就毫无保留地分享了 HF0 到底是怎么奏效的、他们在 HF0 的实际体验与收获,和实现 10 倍增长的具体经验(比如他们是怎么一招就让公司一夜之间收入翻倍的?)。如果你对 Joe 的参加孵化器的经验,或者对去美国参加类似的组织感兴趣,可以添加我的微信 qukai42,42章经今年也会组织更多中美连接的活动和事情,欢迎你用各种方式加入进来。【人类博物馆】导游:曲凯,42章经创始人20 号珍藏:Joe,ACE Studio 创始人。ACE Studio 是一款面向专业音乐制作人和创作者的 AI 音乐工作站,致力于用 AI 重新定义音乐创作,自 2023 年 10 月上线以来发展迅猛,月收入已达 80 万美金。【时光机】Part1 HF0 为什么有效 01:23 先回顾下入选这家美国知名孵化器的过程 03:48 英语不好会是阻力吗? 05:34 3000 进 10 的概率下,HF0 为什么选中了你们? 07:19 HF0 和其它孵化器不太一样 08:46 HF0 没教我们怎么做业务,这事也不该别人来教 10:35 最关键的第一步:HF0 给我们注入了「一定能猛涨」的信念感 12:23 这种信念感很难自我激发 14:23 开营后,HF0 营造了一个专注于增长的氛围 16:25 最大的压力和最深的恐惧就是「别丢脸」… 17:44 这种氛围本质上改变了我想问题的方式 19:17 也让我们涌起了「别让大家觉得华人不行」的责任感 21:38 一直 build「憋大招」可能并不成立 22:40 从 HF0 出来后,还能保持在其中的状态吗? 23:55 我们马上要复刻 HF0 的体验 Part2 3 个月涨 10 倍的具体实践 26:50 五周过去都没怎么增长的时候,信念感崩塌了吗? 27:43 绝境逢生的戏剧化转折:我们试了一招,第二天日收入直接 double 28:51 Quora 创始人教会了我们一种思考方法 30:00 之前没想到这么干,是因为我们没悟到一件事 31:18 要问这招是啥?——答案乍一听可能有点搞笑哈 31:29 但搞笑背后是一种硅谷的方法论 32:57 在硅谷的几个经历也启发了我们 33:53 后面我们还试了很多招数,最终达成了 10 倍的增长 34:01 我们在价格模型上做了很多文章 34:24 Blake Anderson(千万美金 ARR 产品 Cal AI 的创始人)让我意识到,我们之前联系 influencer 的方式都不对 36:33 我们把付费广告的 ROI 提高到了 2 倍 36:59 产品功能升级和老用户也没落下 37:30 但前六周的苦工是省不掉的Part3 一些观察 39:02 美国投资人的工作方式和提的问题有什么不同? 40:31 美国机构真的很不喜欢中国团队吗? 42:51 肉身到硅谷去很重要 43:12 我越来越坚信,AI 产品化大有可为 44:44 Perplexity 的 pitch deck 上有两句话,合起来看很妙 45:13 我的壁垒就是我的「人日」 46:47 硅谷的做事风格越来越回归本质了【Reference】 ACE Studio 产品界面 关于 HF0:HF0 是由 Dave Fontenot(世界上最大的黑客松 MHacks 创始人)、Evan Stites- Clayton 和 Emily Liu 共同创立的常驻创业孵化器,有着严苛的筛选标准,由包括 Marc Andreessen、Chris Dixon 在内的多位知名投资者支持,创办第一年就孵化出了 3 家独角兽公司,也孵化过包括 ComfyUI、Story.com 等在内的多家优秀的 AI 公司。【The gang that made this happen】 制作人:陈皮、Celia 剪辑:陈皮 Bgm:Mondo Bongo - Joe Strummer & The Mescaleros
    --------  
    48:32
  • 第一个出 ICU 的 AI 创业者|对谈心影随形 CEO Binson
    Binson literally 进了 ICU,一场严重的车祸让他对这个世界和创业这件事有了不同的认识。这期播客中我们先聊了他的这场车祸,和他是如何度过在 ICU 的六个日夜的,相信这种经历是绝大多数人没有机会尝试甚至是听说的,而 Binson 恢复了四个月后已经可以比较正常地坐在我的对面回顾这段经历,他讲了在这个过程中他心态的一些变化,以及在事故之后他是如何改变他对待人生和经营公司的方式的。Binson 在此之前是知名的大厂高管,他从百度副总监、360 助理总裁,一路做到了 bilibili 副总裁,所以我们也聊了他打工和换工作的很多经验,以及就是他为什么创业,现在又是如何看待 AI 和自己的心影随形(逗逗游戏伙伴)这个公司和产品的。最后,我们的 AI 私董会也在持续报名中,目前已经聚集了一批市场上最好的 AI 创始人,欢迎点击链接报名(里面也有目前已加入的成员名单,可点击查看)【人类博物馆】导游:曲凯,42章经创始人31 号珍藏:Binson,心影随形 CEO。心影随形成立至今已获得多轮融资。逗逗游戏伙伴是其推出的一款陪用户玩游戏的 AI 桌宠软件,已有 600 万的用户规模。此前,Binson 曾先后担任百度副总监、360 助理总裁、bilibili 副总裁等职位。【时光机】Part1 车祸后的感悟 1:52 我是怎么差点挂了的? 2:19 死里逃生的过程 7:56 更痛苦的是躺进 ICU 后的精神煎熬 12:01 我们活着的意义到底是啥? 13:58 这件事教会了我「停下来」和「放手」的重要性 17:35 我创业的心态和行动有些具体的变化Part2 大厂打工 V.S. 创业的体悟 22:38 如果真的只为了赚钱,不要创业 23:04 复盘三段大厂经历 23:20 我应该更早离开百度 25:09 为什么不应该为了两三倍工资而跳槽? 27:15 为什么 20 年我选择去 B 站,而不是字节、快手、拼多多或者小红书? 29:43 原本没想去 360,但周鸿祎给了我一个新的视角 35:12 作为一个如此有创业精神的人,为什么没有更早出来? 37:33 创业首先要摒弃大厂思维 42:46 创业总是焦虑?多半是因为事先思考得不够充分 44:42 不要回避大厂竞争的问题 45:25 创业最难的是招人和统一大家的思路 46:22 成长最快的是工作两三年的 47:31「有爱」可以后天培养吗? 47:57 一个残酷的现实是,大厂已经不育人了 49:13 分享一个有效训练决策能力的方法Part3 聊聊 AI 51:12 桌宠形态产品的留存高是一个值得炫耀的事么? 52:06 为什么逗逗游戏伙伴很难被 copy? 53:46 一些 AI 观察 54:10 今年会陆续有一批 AI 公司被淘汰 55:08 LLM 的进展超出预期,多模态则不及预期 55:53 Chatbot 这种模式可能就不对 56:17 我们不看对话轮数、不看留存、不看时长 58:49 一个值得思考的未来方向【Reference】 Binson 交通事故的完整经历和更多感悟,可以看他之前写的公众号mp.weixin.qq.com 逗逗游戏伙伴桌宠形态的示意图: 逗逗游戏伙伴陪玩《黑神话:悟空》的示意视频【The gang that made this happen】 制作人:陈皮、Celia 剪辑:陈皮 Bgm:Mondo Bongo - Joe Strummer & The Mescalero
    --------  
    1:03:10

Plus de podcasts Technologies

À propos de 42章经

你好,我是曲凯,42章经的创始人。 小的时候我不太舍得花钱,记得当年一毛钱一袋的牛肉干真的很好吃,但如果偶尔遇到一个很有趣的人,我会欣然花几十、上百块请他吃个饭,还觉得自己赚到了。 后来长大了一些,开始刷人人网、豆瓣、知乎、再到现在的即刻…… 你有没有偶尔在这些平台刷到过一个很有缘的人,然后在一个夏日的午后,把他的发言、转载和收藏全都看了一遍,并觉得心有戚戚焉。 再后来工作和创业以后,每天就是聊各种各样的投资人、创业者。 如果能聊到一个优秀的人,真的会有一种如沐春风的感觉,并真心觉得很幸福。 而同行们见面经常会聊到的问题也是:最近有没有遇到什么有意思的人? 所以,这个播客就是要努力把这些人带到你的身边。 我们只专注和有趣、有独到认知、又愿意坦诚分享的聪明人聊天。 希望你听完每一期都能回到小时候,回到那个因为认识了有趣的人、收获了新知,而感到单纯美好幸福的时刻。 如果听完以后,你还能暗自感慨一句, “我也好想认识这个人啊。” 或者, “哇靠,有被启发到。” 那这个播客也就值了。
Site web du podcast

Écoutez 42章经, Comptoir IA 🎙️🧠🤖 ou d'autres podcasts du monde entier - avec l'app de radio.fr

Obtenez l’app radio.fr
 gratuite

  • Ajout de radios et podcasts en favoris
  • Diffusion via Wi-Fi ou Bluetooth
  • Carplay & Android Auto compatibles
  • Et encore plus de fonctionnalités
Applications
Réseaux sociaux
v7.16.2 | © 2007-2025 radio.de GmbH
Generated: 4/23/2025 - 10:26:41 PM