Langfuse

📅 活動時間：2026-07-02 15:30-16:00 🔗 活動連結 📘 聯繫我 Facebook 📑 投影片 Title LLM O11y：從 Observability 到 Decision System Outline 在導入 LLM 與 Agent 開發流程時，團隊常面臨規格難以驗證、品質無法量化、以及回歸測試成本高等痛點。本分享將介紹如何在 AI Agent Coding 流程中結合 Langfuse 與 LLM-as-a-judge，將自然語言規格轉化為可執行的 evaluation，建立自動化的驗證與 feedback loop。你將學到如何使用 llm ai gateway、langfuse tracing、實作 evaluation & judge 流程、抽取 dataset，打造第一個可觀測、可量化的 AI 開發工作流，讓 Agent 系統開發更穩定、更可預測。用 impression 做 model/framework 選擇決策。使用新 model framework 可能增加 latency 與降低可用度從 observability 開始: bifrost + langfuse observability 還不夠：Observability != Decision System LLM-as-a-judge 的價值與限制從 observability 到 closed-loop feedback system evaluation / dataset / regression / decision gate llm-o11y PoC：decision layer 最小可行實作把 LLM framework 選擇，從 gambling 變成可驗證決策 Demo & POC https://github.com/chechiachang/llm-o11y ...

📅 活動時間：2026-07-02 13:30-15:00 🔗 活動連結 📑 投影片 📘 Workshop Repo chechiachang/llm-o11y Workshop Overview 這是一場 hands-on workshop，目標是把 LLM 應用從「可觀測」推進到「可評估、可決策」。你會在自己的電腦上直接跑完整流程，從 tracing 到 evaluation，再到 workflow 落地。 Agenda Docker Compose 在 localhost 啟動 Bifrost 與 Langfuse 串接 LLM AI Gateway 與 Langfuse tracing 建立 evaluation 與 LLM-as-a-judge 從實務觀測資料抽取 dataset 串成可重現的開發 workflow What You Will Build 本地可執行的 observability stack（Bifrost + Langfuse）一條可重跑的 evaluation pipeline 可持續擴充的 dataset 與 regression 基礎能用於模型/框架決策的 workflow Prerequisites 自備筆電（must bring your own PC）可連外網路（stable network required）可使用 Docker / Docker Compose 可使用 Git 與 terminal Workshop Resources Azure OpenAI models will be provided by the workshop. Target Audience 正在導入或維運 LLM / Agent 系統的工程團隊想建立 tracing + evaluation + decision flow 的 Tech Lead / SRE / Platform Team 想把 PoC 推進到可持續工作流的開發者