Chrome built-in AI API 簡介

簡介

網頁技術的演進始終以提升使用者體驗與開發者效率為目標。為此，Google 在 Google Chrome 瀏覽器導入了「內建 AI API」能力，讓開發者能直接在網頁應用程式（Web App）中整合 AI 功能。本文將介紹這些 API 和它們的優勢，以及開發者如何運用它們打造更智慧的網頁應用程式。

Chrome 內建的 AI API

Chrome 內建 AI 方案涵蓋多項 API，各自適用於不同任務。根據官方文件，目前可用的 API 包括：

Translator API（翻譯 API）： 將使用者產生或動態內容即時翻譯。
Language Detector API（語言偵測 API）： 偵測輸入文字所使用的語言。
Summarizer API（摘要 API）： 將長內容濃縮為簡潔摘要。
Writer API（撰寫 API）與 Rewriter API（改寫 API）： 撰寫新內容或改寫/重構現有文字。
Prompt API（提示 API）： 向內建的 AI 模型傳送自然語言請求。
Proofreader API（校對 API）： 提供即時校對、修正文字訊息或文件內容。

另外，根據官方文件說明：這些 API 皆由 Gemini Nano（Google 輕量級大型語言模型）提供支援。

內建 AI 的優勢

將 AI 能力整合到瀏覽器端有幾項優勢：

部署更簡單： 模型由瀏覽器管理其分發與更新，開發者無需自行處理大型 AI 模型的下載與維護。
硬體加速： Chrome 的執行環境會善用可用的硬體資源（如 GPU／NPU）以確保效能最佳化。
更高的隱私保護： 資料可在使用者裝置端處理，減少外部資料傳輸，提升安全性。
更佳使用者體驗： 本地處理可降低延遲，支援即時回應；某些情況下甚至可離線操作。
多階段與多樣 API 支援： 官方指出，不同 API 處於不同開發階段（Stable、Origin Trial、EPP）以供開發者逐步測試與使用。

使用情境

Translator API

可即時翻譯動態或使用者產生內容。例如：在社群平台中，使用者在時間軸上看到不同語言的貼文時，可即時請求翻譯。

Language Detector API

用於判定文字所使用的語言，是翻譯流程中關鍵一環。例如：辨識未知來源語言，再自動選擇目標語言進行翻譯；或為社群貼文標注語言以改善螢幕閱讀器的發音。

Summarizer API

可將長格式內容轉為簡潔摘要，便於使用者快速掌握重點。常見使用情境包括：會議記錄摘要、客服對話重點整理、產品評論摘要、長篇文章選讀指標、甚至用於為文章產生初稿標題。

Writer API 與 Rewriter API

Writer API： 用於根據指定寫作任務與上下文生成新內容。
Rewriter API： 用於重構、改寫或調整既有文字（例如：改變語氣、調整長度、改為更正式或更口語）。兩者目前正處於 Origin Trial／EPP 階段，尚未完全穩定。

Prompt API

允許開發者向 Gemini Nano 模型傳送自然語言指令，用於各種 AI 驅動操作。

Proofreader API

可用於瀏覽器內提供互動式校對，例如：修正文法、協助用戶編輯文件、即時聊天訊息修正、部落格／論壇留言校稿等。

開始使用

若要在 Web App 中整合這些 API，可依照以下步驟：

加入 Early Preview Program (EPP)： 取得最早期實驗性 API 的使用權，並提供回饋以協助改善。
啟用本地測試（localhost）： 在 Chrome 中輸入 chrome://flags 啟用相關 API 旗標，便可在本地開發環境測試。
參加 Origin Trial： 對於已開放 Origin Trial 的 API，可將你的網站註冊為試用，於真實環境下進行測試。官方文件也有提供「Usage Requirements」說明。
遵循設計與良好實踐： 由於這些 API 由 Gemini Nano 提供，Google 官方建議再開始使用前，可以先參考 People + AI Guidebook 的設計方法與實例，確保使用安全、具包容性與可解釋性。
參考官方文件開始開發與測試

結論

Chrome 的內建 AI API 是網頁開發的重要里程碑：讓 Web 原生支援翻譯、語言偵測、摘要、撰寫校對與自然語言提示等 AI 相關功能。我們可以利用這些 API 打造更智慧的應用程式，同時受惠於瀏覽器端運算、低延遲、高隱私的特性。隨著這些功能的逐步成熟，Web App 的智慧化體驗也將邁向新的高度。

參考資料

Chrome for Developers - Built-in AI APIs

Categories