大 AI 時代將至,你不可不讀的語言模型獨門祕笈
帶你輕鬆遨遊生成式 AI 的世界
本書內容改編自第15屆 iThome 鐵人賽 AI & Data 組冠軍系列文章《LLM 學習筆記》,這是個生成式 AI 崛起的年代,其中又以 ChatGPT 為首的大型語言模型(Large-Scale Language Model, LLM)們最為令人驚豔,但是每當我們提到 LLM 時,腦中浮現的可能都是一些參數量龐大、架構絢麗又複雜、沒有個幾千幾百張 GPU 跑不動的超複雜數學模型!
其實掌握語言模型並沒有那麼困難,本書介紹了許多在建立 LLM 相關應用時會使用到的技術:在雲端可以透過簡單的 ChatGPT API 打造有趣的塔羅占卜應用;在地端有 Hugging Face TGI、vLLM、llama.cpp 等推論框架,就算只有單顯卡也能高速部署、輕鬆玩轉各式各樣 Open Source 的 LLM。透過多種量化技術減少記憶體開銷,小顯卡也能推動大模型!還有許多文本檢索的技巧,帶你一步步構築出 RAG 實務應用。最後當然少不了,透過 LoRA 訓練手法輕鬆打造專屬於你的客製化語言模型!
筆者根據自身的實務經驗,介紹深入但是易懂的理論,使用簡單但是務實的技術,帶領大家瞭解如何在低成本、低資源的環境中打造 LLM 相關應用。無論你是求知若渴的研究員,或是躍躍欲試的工程師,都能從本書中得到滿滿的收穫!
重點摘要
✦ 語言模型
雲有 ChatGPT,地有 Llama
✦ 推論部署
不只高速生成,還要低成本量化
✦ 檢索應用
掌握提示工程,徹底瞭解 RAG
✦ 微調訓練
活用 LoRA 訓練,打造客製化模型
本書可以學到哪些知識
● 量化:減少模型的顯示卡記憶體使用量。
● 部署:將模型以後端服務的形式進行部署。
● 推論:如何達到更快速的文字生成速度。
● 微調:調整訓練模型的權重以符合應用需求。
● 檢索:從外部知識庫搜尋相關資料輔助模型生成。
● 應用:結合以上技術搭建出一個實際的應用。
目標讀者
.對 LLM 充滿好奇的讀者
.想要嘗試涉足 AI 領域的初學者
.想要簡單瞭解 LLM 相關理論的領導者
.想要深入學習 LLM 相關技術的工程師
.想要一本 AI 相關的書籍,又不想要內容太深澀難懂的休閒玩家
.擁有自己的機器,想要實際動手玩轉語言模型的深度玩家
.大 AI 時代來臨,手邊卻還沒有一本 AI 相關書籍的朋友