Cloud Summit 2025: 用 RAG 打造企業可對話 AI 知識庫《有問題問過 AI 後再來問我》

活動時間: 2025-07-03T12:45:00Z 活動連結 Facebook Twitter 投影片 WIP Info 開發團隊需要將經驗與知識,透過文件化的方式保存下來,以便未來查詢與學習。然而,企業內部文件往往分散於 Confluence、Google Drive、Notion 等平台,傳統關鍵字搜尋難以快速獲取準確資訊,導致溝通成本高、開發流程受阻。又或是,當開發團隊需要查詢特定知識時,往往需要透過 Slack、Email 等方式詢問同事,這樣的溝通成本不僅浪費時間,也容易造成資訊不對稱。 本演講將介紹如何運用 RAG(Retrieval-Augmented Generation)技術,結合 OpenAI 及向量數據庫,將企業內部文檔轉為智能知識庫。 我們將探討文件解析、嵌入索引、AI 問答系統的技術架構與實作,幫助開發團隊構建高效 AI 助手,節省溝通成本,加速開發流程,提升決策與問題解決能力。 大綱: 為什麼企業知識管理難? 文件分散(Confluence、Google Drive、Notion、SharePoint) 搜索體驗不佳,開發者找不到關鍵資訊 知識難以沉澱,員工流失即知識流失 RAG 如何解決這些問題? 透過檢索增強生成(Retrieval-Augmented Generation)提升答案準確性 把內部文件轉為可查詢的知識庫 讓 AI 提供具體、準確、即時的回覆 技術架構與實作指南 文件解析與嵌入(HTML、Markdown、Confluence API) 使用向量數據庫實現高效檢索 OpenAI API + LangChain 打造智能問答系統 案例分享與落地經驗 Target group Author Che-Chia Chang 是一名專注於後端開發、開發維運、容器化應用及 Kubernetes 開發與管理的技術專家,同時也是 Microsoft 最有價值專業人士(MVP)。 活躍於台灣技術社群,經常在 CNTUG、DevOps Taipei、GDG Taipei、Golang Taipei Meetup 等社群分享 DevOps、SRE、Kubernetes 及雲端運算相關技術。致力於推動開發與維運的最佳實踐,並熱衷於研究與應用最新的雲端與 AI 技術。 個人部落格:https://chechia.net Che-Chia Chang is a technology expert specializing in backend development, DevOps, site reliability engineering (SRE), containerized applications, and Kubernetes development and management. He is also recognized as a Microsoft Most Valuable Professional (MVP). ...

June 9, 2025 · 1 min · 206 words · chechiachang

Workshop: DevOpsDay 2025: RAG打造企業AI知識庫:把一甲子功力傳給新人

活動時間: 2025-06-05T12:45:00Z 活動連結 Facebook Twitter 投影片 RAG workshop 行前通知 本次 workshop 以 hands-on 的方式進行,累積操作經驗為主,講解與說明為輔。觀念內容有準備教材,需要參與者自行閱讀。講師會免費提供 Azure OpenAI models API key (gpt-4.1, gpt-4.1-mini, text-embedding-3, text-embedding-ada-002…) Azure VM 供同學遠端操作使用 –> 投影片與教材 <– Workshop 基本需求 有自己的電腦,可以上網 選項1: 使用自己的電腦,在 docker 啟動開發環境 選項2: 使用自己的電腦,遠端連線講師提供的 VM,在VM 中啟動 docker 開發環境 會使用 docker 會使用 python 與 jupyter notebook 會使用 chatgpt.com 協助除錯 選項1: 使用自己的電腦 在 workshop 開始前,在自己的電腦上 安裝 docker git clone github repository 啟動 docker 開發環境,下載 docker images 開啟瀏覽器,連線到 Jupyter Notebook,token workshop1234! 在 Jupyter Notebook 中,安裝所需的 Python 套件 git clone https://github.com/chechiachang/rag-workshop.git cd rag-workshop docker compose up -d docker exec -it notebook pip install pandas openai qdrant_client tqdm tenacity wget tenacity unstructured markdown ragas sacrebleu langchain_qdrant langchain-openai langchain_openai langchain_community tiktoken 選項2: 使用遠端 VM 建議使用個人電腦,畢竟免費 VM 名額現場有限 需要有自己的電腦,有穩定的網路,可以連線到遠端 VM 需要註冊 tunnel 工具(沒有業配)ngrok 登入 Login -> 左手邊 Identity & Access -> Authtokens -> Add Tunnel authtoken -> 記在安全的地方 也可以使用 pinggy,但免費有限時 投影片與教材會放在網站上 https://chechia.net/zh-hant/slides/2025-06-05-devops-rag-internal-ai/ ...

June 5, 2025 · 2 min · 387 words · chechiachang

IThome 2022 DevOpsDay Introducing policy as code for terraform

Titleq 從零導入 Policy as Code 到 terraform 甘苦談 - Introducing policy as code for terraform Presentation Google Slides Description Terraform 是一個很棒的 Infrastructure as Code 的工具,能夠以現代的軟體工程流程來穩定的建構 infrastructure,並隨著需求變更自動化迭代,將新的 feature 安全地更新到既有的 infrastructure 上。只要是 Infrastructure 有關的問題,我一律推薦 Terraform。 這也意味 Terraform 的品質就等於 infrastructure 的品質,好的 terraform 帶你上天堂,不好的 terraform 全 team 火葬場。 Infrastructure 有太多資安的考量,新的風險不斷被檢查出來,連帶要不斷的 patch terraform code 來避免潛在的資安風險 Infrastructure 會不斷地更新,例如公有雲的 api 不斷更新,去年的 code 已經跟不上今年的最佳實踐了 好的工程師寫出的 terraform code 屌打菜鳥工程師,要如何讓團隊依循更好的實踐,避免寫出爛 code 維護 code 有 clean code / best practice,Terraform 也有 clean code 與 best practice,工程師要如何工具來輔助,是 Policy as Code 的一大課題。 本演講聚焦於實際經驗,從一大堆 terraform modules 開始,沒有 Policy as Code,到一步步評估、導入、實作、改進與迭代,逐漸的提升團隊 Terraform code 品質,提升 infrastructure 交付品質,並避免到未來潛在的風險。 ...

June 9, 2022 · 2 min · 248 words · chechiachang

2022 05 21 COSCUP Operating Time Series Database in K8s

Titleq 在 k8s 上跑 time series database 甘苦談 - Operating Time Series Database in K8s Google Slides Youtube live record: https://youtu.be/YexUnVOZC8M?t=9421 Description Influxdb 為市占最高的 time series DBMS 之一,使用上與 RDBMS 有不同優劣勢。 在維運方面,database 有許多相似需求:穩定性、高可用性、備份、還原、資源管理、調度、災難復原…等。社群常聽到有人問:可不可以在 K8s 上跑 database。 本演講會分享在 k8s 中維運,實務上所遇到的問題,提供一些思考方向。 本次演講的 influxdb 版本為 Influxdb OSS / enterprise 1.9+ InfluxDB is one the the most popular time series database management system (DBMS) and is a powerful platform when dealing with time series data. DBMSs, including RDBMS, have many similar requirements on aspect of infrastructure operation. They all require stability, high availability, backup and restore utilities, cpu / memory resource management, disaster recovery…etc. People often ask about that whether is it ok to run DBMS in kubernetes cluster or not. This lecture try to provide some points from our experiences dealing with real-world issues. ...

May 21, 2022 · 2 min · 345 words · chechiachang

Terraform Infrastructure as Code Transcript

This article is part of 從零開始的 Infrastructu as Code: Terraform Get-started examples / SOP on Github Introducation to Terraform Iac: Speaker transcript Presentation Check my website chechia.net for other blog. Follow my page to get notification. Like my page if you really like it :) 各位好 About this presentation 開始之前,先分享一些資源 投影片 講稿 程式碼 SOP 範本 Facebook 粉專 都放在這裡,因為有附逐字稿,所以如果很忙的朋友,掃了 QR code 就可以回家自己看了,不用客氣。 然後有興趣在追這系列文章的,可以幫我 facebook 粉專按個讚跟追蹤,每周新文章出來,會推播通知。 文章在 chechia.net 上,新文章通知靠 facebook 粉專這樣。也可以只追蹤不按讚。我自己看別人技術 blog 也很常這樣(XD 需求 好,今天來講得這個 Terraform ...

June 15, 2020 · 5 min · 915 words · chechiachang