LLM O11y:從 Observability 到 Decision System

📅 活動時間:2026-07-02 15:30-16:00 🔗 活動連結 📘 聯繫我 Facebook 📑 投影片 Title LLM O11y:從 Observability 到 Decision System Outline 在導入 LLM 與 Agent 開發流程時,團隊常面臨規格難以驗證、品質無法量化、以及回歸測試成本高等痛點。本分享將介紹如何在 AI Agent Coding 流程中結合 Langfuse 與 LLM-as-a-judge,將自然語言規格轉化為可執行的 evaluation,建立自動化的驗證與 feedback loop。你將學到如何使用 llm ai gateway、langfuse tracing、實作 evaluation & judge 流程、抽取 dataset,打造第一個可觀測、可量化的 AI 開發工作流,讓 Agent 系統開發更穩定、更可預測。 用 impression 做 model/framework 選擇決策。使用新 model framework 可能增加 latency 與降低可用度 從 observability 開始: bifrost + langfuse observability 還不夠:Observability != Decision System LLM-as-a-judge 的價值與限制 從 observability 到 closed-loop feedback system evaluation / dataset / regression / decision gate llm-o11y PoC:decision layer 最小可行實作 把 LLM framework 選擇,從 gambling 變成可驗證決策 Demo & POC https://github.com/chechiachang/llm-o11y ...

May 2, 2026 · 2 min · 255 words · chechiachang

Workshop: LLM O11y 從 Observability 到 Decision System

📅 活動時間:2026-07-02 13:30-15:00 🔗 活動連結 📑 投影片 📘 Workshop Repo chechiachang/llm-o11y Workshop Overview 這是一場 hands-on workshop,目標是把 LLM 應用從「可觀測」推進到「可評估、可決策」。 你會在自己的電腦上直接跑完整流程,從 tracing 到 evaluation,再到 workflow 落地。 Agenda Docker Compose 在 localhost 啟動 Bifrost 與 Langfuse 串接 LLM AI Gateway 與 Langfuse tracing 建立 evaluation 與 LLM-as-a-judge 從實務觀測資料抽取 dataset 串成可重現的開發 workflow What You Will Build 本地可執行的 observability stack(Bifrost + Langfuse) 一條可重跑的 evaluation pipeline 可持續擴充的 dataset 與 regression 基礎 能用於模型/框架決策的 workflow Prerequisites 自備筆電(must bring your own PC) 可連外網路(stable network required) 可使用 Docker / Docker Compose 可使用 Git 與 terminal Workshop Resources Azure OpenAI models will be provided by the workshop. Target Audience 正在導入或維運 LLM / Agent 系統的工程團隊 想建立 tracing + evaluation + decision flow 的 Tech Lead / SRE / Platform Team 想把 PoC 推進到可持續工作流的開發者

May 2, 2026 · 1 min · 121 words · chechiachang