LLM O11y:從 Observability 到 Decision System

📅 活動時間:2026-07-02 15:30-16:00 🔗 活動連結 📘 聯繫我 Facebook 📑 投影片 Title LLM O11y:從 Observability 到 Decision System Outline 在導入 LLM 與 Agent 開發流程時,團隊常面臨規格難以驗證、品質無法量化、以及回歸測試成本高等痛點。本分享將介紹如何在 AI Agent Coding 流程中結合 Langfuse 與 LLM-as-a-judge,將自然語言規格轉化為可執行的 evaluation,建立自動化的驗證與 feedback loop。你將學到如何使用 llm ai gateway、langfuse tracing、實作 evaluation & judge 流程、抽取 dataset,打造第一個可觀測、可量化的 AI 開發工作流,讓 Agent 系統開發更穩定、更可預測。 用 impression 做 model/framework 選擇決策。使用新 model framework 可能增加 latency 與降低可用度 從 observability 開始: bifrost + langfuse observability 還不夠:Observability != Decision System LLM-as-a-judge 的價值與限制 從 observability 到 closed-loop feedback system evaluation / dataset / regression / decision gate llm-o11y PoC:decision layer 最小可行實作 把 LLM framework 選擇,從 gambling 變成可驗證決策 Demo & POC https://github.com/chechiachang/llm-o11y ...

May 2, 2026 · 2 min · 255 words · chechiachang

Workshop: LLM O11y 從 Observability 到 Decision System

📅 活動時間:2026-07-02 13:30-15:00 🔗 活動連結 📑 投影片 📘 Workshop Repo chechiachang/llm-o11y Workshop Overview 這是一場 hands-on workshop,目標是把 LLM 應用從「可觀測」推進到「可評估、可決策」。 你會在自己的電腦上直接跑完整流程,從 tracing 到 evaluation,再到 workflow 落地。 Agenda Docker Compose 在 localhost 啟動 Bifrost 與 Langfuse 串接 LLM AI Gateway 與 Langfuse tracing 建立 evaluation 與 LLM-as-a-judge 從實務觀測資料抽取 dataset 串成可重現的開發 workflow What You Will Build 本地可執行的 observability stack(Bifrost + Langfuse) 一條可重跑的 evaluation pipeline 可持續擴充的 dataset 與 regression 基礎 能用於模型/框架決策的 workflow Prerequisites 自備筆電(must bring your own PC) 可連外網路(stable network required) 可使用 Docker / Docker Compose 可使用 Git 與 terminal Workshop Resources Azure OpenAI models will be provided by the workshop. Target Audience 正在導入或維運 LLM / Agent 系統的工程團隊 想建立 tracing + evaluation + decision flow 的 Tech Lead / SRE / Platform Team 想把 PoC 推進到可持續工作流的開發者

May 2, 2026 · 1 min · 121 words · chechiachang

Workshop: Spec-driven development with Spec-kit

📅 活動時間:2026-07-02 09:00-10:30 🔗 活動連結 📘 聯繫我 Facebook 📑 投影片 Workshop Spec-kit 規格導向開發實作 Outline 使用 AI agent 進行規格導向開發(Spec-driven development, SDD)已成為現代軟體開發的重要趨勢。SDD 強調在開發過程中以明確的規格作為指導,從而提高開發效率和產品質量。在這場工作坊中,我們將深入探討 SDD 的核心概念,並通過實際操作 Spec-kit 來學習如何撰寫可執行的規格、利用範本和自動化腳本,以及將這些規格整合到日常的開發流程中。參與者將獲得制定策略、建立規格以及使用 Spec-kit 加速開發和驗證的實用技能。 這場工作坊將帶領大家從 SDD 的核心概念出發,藉由 Spec-kit 的實作示範,學習如何撰寫具有可執行性的規格、善用範本與自動化腳本,以及將這些規格系統整合到日常工作流程。 課程結束後,你能掌握制定策略、建立規格、以及利用 Spec-kit 加快開發與驗證的思路。 大綱 SDD 的核心概念與實踐流程 挑選適合的場景與任務,制定 SDD 策略 使用 Spec-kit 撰寫可執行規格 為何會有幫助:避免 Spec drift 多數團隊導入 AI 寫程式後,常見痛點是需求、規格、實作與測試不同步,最後演變成 Spec drift,導致返工與品質不穩定。 本次工作坊聚焦如何用 Spec-kit / SDD 建立「規格先行、可執行驗證、持續對齊」的流程,讓 AI 與工程團隊使用同一份契約協作。 你會看到一套可直接落地的做法:從需求釐清、規格撰寫、實作到驗證,縮短溝通迴圈、降低偏移風險,並提升交付一致性與可維護性。 Target group 本次工作坊提供可遠端連線的 Azure OpenAI 模型環境,請先準備筆電並安裝好 VS Code 與 Vs Code Codex Extension,並參考以下資源完成相關設定: ...

May 1, 2026 · 2 min · 222 words · chechiachang

DevOpsDay: 規格驅動的 AI 強化 DevOps

📅 活動時間:2026-06-26T17:00-17:40 🔗 活動連結 📘 聯繫我 Facebook 📑 投影片 Title 規格驅動的 AI 強化 DevOps 平台工程 AI-powered Spec-driven DevOps Platform Engineering Outline 現代 DevOps 的守備範圍日益擴張,從開發、測試、部署到維運、安全與合規,工作內容愈發碎片化且分散。團隊不僅要處理高度例行且需精確執行的任務,還要面對跨團隊協作與流程整合的複雜度。 在 DevOps 日常運作中,存在大量適合導入 Spec-driven development(SDD)的場景,特別是需求明確、重複性高且風險較低的任務。透過可執行規格結合 AI 自動化,可提升效率並降低人為失誤。 本次演講將分享如何結合 AI 與 SDD,自建自動化系統,處理低磨合、低風險的日常事務,讓工程人力回歸高價值工作。 Spec-kit 設計:以 spec 作為 single source of truth,串接需求、驗收與交付 規格:goal、constraints、acceptance criteria、checks 適合先導入的場景:SOP、Runbook、高耗時例行工作 將規格接入 CI/CD 與監控流程,形成可驗證回饋循環 Target group DevOps / SRE / Platform 工程師 需要維護大量 SOP 與 Runbook 的團隊 想導入 AI 自動化且重視治理、品質與風險控制的技術主管 主要收穫 理解如何判斷哪些 DevOps 任務適合以 SDD 優先導入 學會使用 Spec-kit 撰寫與管理可執行規格 建立從規格到交付、驗證與回饋的實務流程 以實務案例理解導入過程中的風險邊界與常見踩雷點 References https://github.blog/ai-and-ml/generative-ai/spec-driven-development-with-ai-get-started-with-a-new-open-source-toolkit/ https://github.com/github/spec-kit/blob/main/spec-driven.md Slides 完整投影片與講稿 Author Che-Chia Chang 是一名專注於後端開發、開發維運、容器化應用及 Kubernetes 開發與管理的技術專家,同時也是 Microsoft 最有價值專業人士(MVP)。 ...

April 25, 2026 · 1 min · 185 words · chechiachang

K8s Summit 2025: RAG + k8sGPT 檢索增強生成與 K8sGPT

📅 活動時間:2025-10-23T13:30-14:10 (ABC會議室) 🔗 活動連結 📘 聯繫我 Facebook 📑 投影片 Outline K8sGPT 是一個結合 AI 的 Kubernetes 叢集診斷與自動化排錯工具,能自動掃描叢集狀態、辨識異常並用自然語言解釋問題,提供可執行的修復建議,甚至支援自動修復。K8sGPT 讓使用者用更低門檻掌握叢集健康狀況,加速問題定位與排除,是 DevOps 與 SRE 團隊提升營運效率的實用工具。 在排查問題時,比起人類工程師,K8sGPT 缺乏對 workload 架構的深入了解,也無法存取內部架構設計文件,或是 Runbook 與 SOP。這限制了其診斷能力並可能因為幻覺(hallucination)而提供不正確的建議。K8sGPT 主要依賴 Kubernetes API 與叢集狀態資訊來進行診斷,但這些資訊並不足以涵蓋所有可能的問題情境。 本次演講展現一個使用案例,嘗試透過 RAG(Retrieval-Augmented Generation 檢索增強生成)技術來增強其診斷能力,展現目前基於大語言模型的解決方案,面對 Kubernetes 叢集問題時的優勢與挑戰。 參考資料 https://k8sgpt.ai/ KubeCon Europe 2025/04/02 Superpowers for Humans of Kubernetes: How K8sGPT Is Transforming Enter… Alex Jones & Anais Urlichs Author Che-Chia Chang 是一名專注於後端開發、開發維運、容器化應用及 Kubernetes 開發與管理的技術專家,同時也是 Microsoft 最有價值專業人士(MVP)。 活躍於台灣技術社群,經常在 CNTUG、DevOps Taipei、GDG Taipei、Golang Taipei Meetup 等社群分享 DevOps、SRE、Kubernetes 及雲端運算相關技術。致力於推動開發與維運的最佳實踐,並熱衷於研究與應用最新的雲端與 AI 技術。 ...

October 1, 2025 · 1 min · 163 words · chechiachang