簡介
網頁技術的演進始終以提升使用者體驗與開發者效率為目標。為此,Google 在 Google Chrome 瀏覽器導入了「內建 AI API」能力,讓開發者能直接在網頁應用程式(Web App)中整合 AI 功能。本文將介紹這些 API 和它們的優勢,以及開發者如何運用它們打造更智慧的網頁應用程式。
Chrome 內建的 AI API
Chrome 內建 AI 方案涵蓋多項 API,各自適用於不同任務。根據官方文件 ,目前可用的 API 包括:
Translator API(翻譯 API):
將使用者產生或動態內容即時翻譯。
Language Detector API(語言偵測 API):
偵測輸入文字所使用的語言。
Summarizer API(摘要 API):
將長內容濃縮為簡潔摘要。
Writer API(撰寫 API)與 Rewriter API(改寫 API):
撰寫新內容或 改寫/重構 現有文字。
Prompt API(提示 API):
向內建的 AI 模型傳送自然語言請求。
Proofreader API(校對 API):
提供即時校對、修正文字訊息或文件內容。
另外,根據官方文件說明:這些 API 皆由 Gemini Nano(Google 輕量級大型語言模型)提供支援。
內建 AI 的優勢
將 AI 能力整合到瀏覽器端有幾項優勢:
部署更簡單:
模型由瀏覽器管理其分發與更新,開發者無需自行處理大型 AI 模型的下載與維護。
硬體加速:
Chrome 的執行環境會善用可用的硬體資源(如 GPU/NPU)以確保效能最佳化。
更高的隱私保護:
資料可在使用者裝置端處理,減少外部資料傳輸,提升安全性。
更佳使用者體驗:
本地處理可降低延遲,支援即時回應;某些情況下甚至可離線操作。
多階段與多樣 API 支援:
官方指出,不同 API 處於不同開發階段(Stable、Origin Trial、EPP)以供開發者逐步測試與使用。
使用情境
Translator API
可即時翻譯動態或使用者產生內容。例如:在社群平台中,使用者在時間軸上看到不同語言的貼文時,可即時請求翻譯。
Language Detector API
用於判定文字所使用的語言,是翻譯流程中關鍵一環。例如:辨識未知來源語言,再自動選擇目標語言進行翻譯;或為社群貼文標注語言以改善螢幕閱讀器的發音。
Summarizer API
可將長格式內容轉為簡潔摘要,便於使用者快速掌握重點。常見使用情境包括:會議記錄摘要、客服對話重點整理、產品評論摘要、長篇文章選讀指標、甚至用於為文章產生初稿標題。
Writer API 與 Rewriter API
Writer API: 用於根據指定寫作任務與上下文生成新內容。
Rewriter API: 用於重構、改寫或調整既有文字(例如:改變語氣、調整長度、改為更正式或更口語)。
兩者目前正處於 Origin Trial/EPP 階段,尚未完全穩定。
Prompt API
允許開發者向 Gemini Nano 模型傳送自然語言指令,用於各種 AI 驅動操作。
Proofreader API
可用於瀏覽器內提供互動式校對,例如:修正文法、協助用戶編輯文件、即時聊天訊息修正、部落格/論壇留言校稿等。
開始使用
若要在 Web App 中整合這些 API,可依照以下步驟:
加入 Early Preview Program (EPP):
取得最早期實驗性 API 的使用權,並提供回饋以協助改善。
啟用本地測試(localhost):
在 Chrome 中輸入 chrome://flags 啟用相關 API 旗標,便可在本地開發環境測試。
參加 Origin Trial:
對於已開放 Origin Trial 的 API,可將你的網站註冊為試用,於真實環境下進行測試。官方文件也有提供「Usage Requirements」說明。
遵循設計與良好實踐:
由於這些 API 由 Gemini Nano 提供,Google 官方建議再開始使用前,可以先參考 People + AI Guidebook 的設計方法與實例,確保使用安全、具包容性與可解釋性。
參考官方文件 開始開發與測試
結論
Chrome 的內建 AI API 是網頁開發的重要里程碑:讓 Web 原生支援翻譯、語言偵測、摘要、撰寫校對與自然語言提示等 AI 相關功能。我們可以利用這些 API 打造更智慧的應用程式,同時受惠於瀏覽器端運算、低延遲、高隱私的特性。隨著這些功能的逐步成熟,Web App 的智慧化體驗也將邁向新的高度。
參考資料
Chrome for Developers - Built-in AI APIs