PodcastsBusinessStellaxAmy·自定義 Podcast

StellaxAmy·自定義 Podcast

StellaxAmy
StellaxAmy·自定義 Podcast
Latest episode

97 episodes

  • StellaxAmy·自定義 Podcast

    [全英文] Next Level AI Evals for 2026

    24/04/2026 | 53 mins.
    這是 Stella 最近與 Hugo Bowne-Anderson 和 Eddie Landesberg 在 Vanishing Gradients Podcast 上的一次對話,圍繞當下真實產品環境中的 AI evals(AI評測)展開。

    在這期節目中,我們從實踐出發,分享了為什麼 AI evals 在產品中如此關鍵:
    一方面,它是開發階段的“指南針”,幫助團隊不斷迭代、建立有效的反饋閉環;
    另一方面,它又是發佈前的“關卡”,支持團隊做出系統是否可以上線或進入實驗階段的決策。

    我們討論了:
    1. 團隊協同的 AI 評測(Team-Centric AI Evals)
    如何讓產品經理、數據科學家以及領域專家(SMEs)協同參與評測過程,
    在“統一決策者”(benevolent dictator)或去中心化模式之間找到平衡,
    從而構建更全面、更有效的評測體系。
    2. 定制化評測指標(Custom Evaluation Metrics)
    為什麼不能只依賴工具廠商提供的通用指標,
    而需要回到原始數據,識別具體的失敗模式(failure modes),
    避免用“看起來不錯”的指標掩蓋真實問題。
    3. AI評測作為“策略評測”(AI as Policy Evaluation)
    將評測問題轉化為因果推斷問題:
    評測不同“策略”(如prompt、模型)的反事實表現(counterfactual performance),
    並預測線上A/B實驗的結果。
    4. 明確產品邊界與約束(Clear Product Constraints)
    定義AI產品“不能做什麼”往往比“能做什麼”更重要:
    通過嚴格的guardrails防止濫用、控製成本,並保護品牌。
    5. 校准後的 LLM 評測器(Calibrated LLM Judges)
    如何通過統計方法和因果推斷,將 LLM-as-a-judge 與人類專家對齊,
    確保評測結果能夠真實反映用戶價值和業務目標。
    6. 數據直覺與好奇心(Essential Data Curiosity)
    在依賴自動化分析或agent之前,
    先通過人工查看數據建立直覺,
    這是設計有效評測系統的基礎能力。
    7. 統計視角下的 AI 評測(Statistical AI Evaluation)
    從“單元測試思維”轉向“分布思維”:
    利用置信區間(confidence intervals)和統計功效分析(power analysis),
    區分真實改進與統計噪聲。
    8. 前瞻性的合規設計(Proactive Regulatory Compliance)
    在監管尚不明確的階段,
    提前建立嚴謹、可解釋的內部評測標準,
    為未來合規要求做好準備,並形成競爭優勢。
    9. 以人為中心的評測基準(Human-Centric Benchmarking)
    將AI系統建立在人類判斷與用戶價值之上,
    不僅僅依賴自動化分數,
    而是構建真正有韌性、差異化的AI產品。

    留言告訴我你對這一集的想法: https://open.firstory.me/user/cls5sglrw05pc01tr4h0v4ufn/comments

    Podcast 任意門:https://linktr.ee/stellaxamy
    The Cocoons 英文電子報:https://thecocoons.substack.com/

    喜歡我們請訂閱分享喔!

    找我們商業諮詢、加入會員:https://buymeacoffee.com/stellaxamy
    聯絡我們: [email protected]


    Powered by Firstory Hosting
  • StellaxAmy·自定義 Podcast

    EP91: 停著的23小時,才是美國電車真正的商機

    14/04/2026 | 1h 2 mins.
    油價飆升,你慶幸自己開的是電動車嗎?還是正在考慮買一台?本集我們邀請到 Pando Electric 創辦人 Aaron,他對電車情有獨鍾,經歷蘋果、蔚來的電車項目,如今在創業,為美國小區和大樓的車子充電,從能源管理的角度,解決電車普及帶來的基礎設施缺口。

    Pando Electric: https://www.pandoelectric.com/

    Aaron 是 Pando Electric 的共同創辦人。北大物理系出身,博士畢業後進入蘋果,從手錶做到自動駕駛部門,再轉戰蔚來;走了一圈之後,他發現電動車這場革命裡,最被低估的機會不在車本身,而在於電:如何儲、如何分配、如何在不增加電網負擔的前提下,讓每一輛停著的電車都「有事可做」。Pando Electric 的核心概念,是把電車每天停著的那23小時變成能源調度的窗口。

    本集我們深聊了美中電動車充電市場的結構差異、為什麼超充其實並不環保也不經濟、多戶住宅(multi-family communities)的充電困境為何是美國最大的未解痛點,以及在政策不確定的當下,一家能源新創如何定義自己的節奏與邊界。

    對能源轉型、電車產業、或者創業如何在混沌中找到正確的事持續做感興趣嗎?希望
    你喜歡這集的分享!

    00:00:00 高光、歡迎 Aaron
    00:01:48 電動車之路:從蘋果、蔚來到創業的緣由
    00:05:40 為什麼選擇能源切入,而非做自動駕駛
    00:08:50 電車普及帶來的能源缺口:KW 與 KWH 的根本挑戰
    00:17:19 終局願景:電車作為能源水庫
    00:19:30 中美電動車市場三大結構性差異
    00:25:51 為什麼鎖定多戶住宅?美國充電困境的真實面貌
    00:35:27 Pando Electric 的競爭優勢
    00:40:34 Pando Electric 三個產品方向:硬件、軟體、分散式儲能
    00:49:02 創業的節奏:耐心是最大挑戰
    00:58:38 AI 時代能源缺口的機遇,以及 Pando Electric 的長遠願景
    01:00:16 招聘與聯絡方式

    留言告訴我你對這一集的想法:

    Podcast 任意門:https://linktr.ee/stellaxamy
    The Cocoons 英文電子報:https://thecocoons.substack.com/

    喜歡我們請訂閱分享喔!

    找我們商業諮詢、加入會員:https://buymeacoffee.com/stellaxamy
    聯絡我們: [email protected]


    Powered by Firstory Hosting
  • StellaxAmy·自定義 Podcast

    EP90: 雙重人生:白天博彩業做數據分析 晚上說段子

    31/03/2026 | 1h 20 mins.
    Shawn是一位活躍於多倫多的脫口秀演員,同時也是Hard Rock Digital的Analytics Team Lead (正在招人!)。本集他和Stella、Amy聊了從加拿大Tim Hortons等食品業跳槽到美國合法博彩產業的做數據分析的心路歷程。如何找到自己在市場上的niche技能、博彩業和Data Science的意外契合,以及為什麼「數據人的Dream Job可能不在大廠」。喜劇生涯和科技工作,究竟能不能共存?

    Shawn的IG: https://www.instagram.com/shawndoescomedy

    Shawn同時身兼脫口秀演員和資深數據分析師兩個身份。他靠聽Dave Chappelle的單口喜劇自學英文、被朋友推上舞台開始了喜劇生涯;他也從食品業出發,靠著niche的數據分析特長敲開了博彩科技公司的門。本期節目,也為我們揭開了博彩行業的神秘面紗:它的市場規模、數據深度、監管邏輯、以及為什麼Data在這裡比很多傳統行業更受重視。

    00:00:00 節目高光|歡迎Shawn
    00:01:57 喜劇起點、靠Stand Up學英文、英文中文寫段子的差異
    00:09:01 Austin:喜劇聖城的真實氣氛
    00:11:26 北美 vs 中國喜劇產業生態比較
    00:15:23 在食品行業做數據人?
    00:20:24 喜劇表演能提升溝通技巧嗎?
    00:22:07 博彩產業三大分類介紹(Fantasy / Sportsbook / Online Casino)
    00:25:46 三大市場規模比較・各州合法化差異
    00:30:57 博彩app 驚人的用戶滲透率
    00:33:36 博彩業利潤
    00:45:21 博彩業本質是設計體驗,而不是odds
    00:49:51 數據分析師的dream job
    01:02:10 加拿大 vs 美國工作文化
    01:05:54 如何分辨合法 vs 非法博彩公司
    01:12:12 對大廠的祛魅
    01:17:43 Starving Artist的迷思


    留言告訴我你對這一集的想法:

    Podcast 任意門:https://linktr.ee/stellaxamy
    The Cocoons 英文電子報:https://thecocoons.substack.com/

    喜歡我們請訂閱分享喔!

    找我們商業諮詢、加入會員:https://buymeacoffee.com/stellaxamy
    聯絡我們: [email protected]


    Powered by Firstory Hosting
  • StellaxAmy·自定義 Podcast

    EP89: 走過.com泡沫與08金融危機: 三十年科技老兵如何應對AI浪潮?

    17/03/2026 | 1h 27 mins.
    ** 本期是Stella和Amy第二次全英語podcast!

    擁有30年科技產業經歷的Jeff Chen,走過半導體、資安、教育科技、AI策略等多個領域,曾負責HP全球高等教育AI策略。本集他與Stella、Amy深度對話:從一個橫跨HP、Alibaba、Intel三方的中國教育數位化大案,到親身經歷 .com泡沫破裂的故事,再到今天求職困境的第一手心得——一個在科技大浪裡反覆轉型的人,怎麼思考職涯?

    Jeff Chen在1996年從Carnegie Mellon畢業後,從Qualcomm的半導體晶片設計做起,一路走過.com泡沫、矽谷創業、安全科技,最後在HP負責全球高等教育AI策略超過十年。這段職涯軌跡本身就是一份跨域進化的教科書:每一次轉折不是放棄,而是累積。Jeff對在職場中段的三四十代給出了最實用的建議:成為T型人才,讓每一次轉型加分而非歸零。

    🎙️ 「StellaxAmy‧自定義」Podcast
    每期邀請一位朋友,講述中文世界故事、華人故事。和我們一起傾聽自定義人生。

    如果你喜歡本節目或希望與我們合作,Stella和Amy現已開通Buy Me a Coffee會員支持:
    ☕️ 請我們喝杯咖啡
    👩🏻‍🏫 找我們咨詢/創業陪跑
    👉 https://buymeacoffee.com/stellaxamy
    📌 訂閱收聽:

    不要錯過任何一集精彩內容!如果我們的節目對你有啓發,請記得給我們五星好評鼓勵!
    🍎 Apple Podcasts
    🎧 Spotify
    📺 YouTube
    🪐 小宇宙
    🌐 或你喜歡的任何Podcast平台
    👉 https://linktr.ee/stellaxamy

    留言告訴我你對這一集的想法:

    Podcast 任意門:https://linktr.ee/stellaxamy
    The Cocoons 英文電子報:https://thecocoons.substack.com/

    喜歡我們請訂閱分享喔!

    找我們商業諮詢、加入會員:https://buymeacoffee.com/stellaxamy
    聯絡我們: [email protected]


    Powered by Firstory Hosting
  • StellaxAmy·自定義 Podcast

    EP88: Legal AI 爆火背後:為什麼律師還是不買帳?

    03/03/2026 | 1h 14 mins.
    這一集我們邀請了兩位律師朋友,分別來自:
    創投/併購/公司法領域

    國際信託與遺產規劃(高資產客戶的稅務規劃與資產傳承)

    當 Legal AI 在 2025 年被炒到風頭浪尖,Harvey 估值高達 80 億美元,資本瘋狂湧入—— 我們想問一個最現實的問題:
    「AI 真的能取代律師嗎?」
    從 billable hour(計費工時)、法律檢索、合約撰寫,到「灰色地帶(gray area)」裡的風險判斷,我們拆解了律師真實的工作流程,也聊了 Legal AI 的理想與現實落差。

    這一集你會聽到:
    為什麼律師對 AI 的「不信任」比你想像得更深?

    法律產業為什麼容錯空間極低?

    「幻覺(hallucination)」在法律場景到底有多致命?

    Legal AI 的未來是取代律師,還是輔助律師?

    如果有第三方 AI 評測報告,律師會更願意嘗試嗎?

    答案依然是那句經典:
    It depends.
    時間軸
    00:00:00 本集高光
    00:07:11 律師職涯路徑:Junior / Senior / Partner
    00:12:36 Deal 現場:簽名頁的緊張時刻
    00:14:30 什麼是 Billable Hour(計費工時)?
    00:17:17 律所的工作強度
    00:21:55 In-house vs 律所:效率邏輯差在哪?
    00:28:02 Legal AI 在合約裡可能怎麼用?
    00:30:20 文件生成工具的侷限
    00:35:04 稅務規劃裡的「reasonable position」
    00:39:42 律師怎麼做法律檢索
    00:40:00 AI 做法律檢索的幻覺問題
    00:42:58 RAG 系統能幫助法律檢索嗎?
    00:49:12 Harvey AI 的創業故事
    00:55:32 AI 幫律師寫 Email 真的靠譜嗎?
    01:08:00 Legal AI 的未來:取代還是輔助?
    01:12:22 灰色地帶(Gray Area):AI 能承擔風險嗎?



    留言告訴我你對這一集的想法:

    Podcast 任意門:https://linktr.ee/stellaxamy
    The Cocoons 英文電子報:https://thecocoons.substack.com/

    喜歡我們請訂閱分享喔!

    找我們商業諮詢、加入會員:https://buymeacoffee.com/stellaxamy
    聯絡我們: [email protected]


    Powered by Firstory Hosting

More Business podcasts

About StellaxAmy·自定義 Podcast

原「數據女孩的中年危機」Podcast。現「StellaxAmy·自定義」Podcast。每期和我們一起認識一位新朋友,傾聽自定義人生。 ◆ 找我們諮詢、加入會員:https://buymeacoffee.com/stellaxamy ◆ 找我們聊天合作 歡迎來信:[email protected]   歡迎留下評價還有留言!我們都有看喔 ♫ Powered by Firstory Hosting
Podcast website

Listen to StellaxAmy·自定義 Podcast, The Story of Money and many other podcasts from around the world with the radio.net app

Get the free radio.net app

  • Stations and podcasts to bookmark
  • Stream via Wi-Fi or Bluetooth
  • Supports Carplay & Android Auto
  • Many other app features
Social
v8.8.12| © 2007-2026 radio.de GmbH
Generated: 4/24/2026 - 11:01:24 AM