【新一代互動領域】介面革命:從「人機互動」轉向「AI 與 API 的對話」
1. Overview
在過去的數十年間,人類與軟體的互動始終圍繞著圖形使用者介面(GUI)展開。使用者必須學習每一款軟體的佈局、邏輯與操作路徑,將自己的需求「翻譯」成一系列的點擊與輸入。然而,隨著大型語言模型(LLM)進化為具備主動執行能力的 AI 代理人(AI Agents),我們正處於一場深刻的「介面革命」前夕。這場革命的核心是從「人機互動」轉向「AI 與 API 的對話」[1]。
正如 OpenClaw 創辦人 Peter Steinberger 在近期專訪中所預測,「80% 的應用程式將會消失」[2]。這並非指軟體功能的消亡,而是指作為「資料庫前端」的 App 介面將變得多餘。當 AI 能夠直接理解使用者的自然語言意圖,並透過標準化的協議(如 Model Context Protocol, MCP)直接與後端 API 或本地數據進行對話時,傳統繁瑣的 UI 操作將被無縫的自動化工作流所取代。本文件將深入探討這一轉型的技術架構、核心機制以及開發者應如何應對這場「軟體大滅絕」。
2. Architecture / Design
介面革命的本質是將「操作權」從人類手中移交給 AI,而人類則保留「決策權」與「目標設定權」。這需要一套全新的架構來支撐 AI 代理人與數位世界的互動。
2.1 從 GUI 到 AUI 的演進 (Evolution of Interfaces)
軟體介面的演進可以被視為一個不斷降低「互動摩擦力」的過程:
| 階段 | 介面類型 | 核心特徵 | 使用者負擔 |
|---|---|---|---|
| CLI | 命令列介面 | 需記憶精確指令與參數。 | 極高:需學習專門語法。 |
| GUI | 圖形介面 | 透過視覺化按鈕與選單引導操作。 | 中:需學習軟體佈局與邏輯。 |
| LUI | 語言介面 | 透過自然語言對話獲取資訊。 | 低:直接表達需求,但僅限文字輸出。 |
| AUI | 代理介面 | AI 主動調用工具/API 完成目標。 | 極低:設定目標,AI 處理執行細節。 |
2.2 AI 與 API 對話的核心機制
在 AUI 架構下,AI 不再只是回傳文字,而是成為一個「協調者(Orchestrator)」。其運作依賴於以下三個關鍵環節:
2.2.1 意圖識別與任務編排 (Intent & Planning)
當使用者輸入「幫我分析這週的開支並調整下週的預算」時,AI 首先會將此模糊目標拆解為一系列具體的 API 呼叫步驟。這涉及到對上下文的深度理解,以及對可用「工具(Tools)」的精確匹配。
2.2.2 Model Context Protocol (MCP) 的標準化作用
為了讓 AI 能夠與成千上萬種軟體對話,我們需要一個通用的「插座」。Anthropic 推出的 MCP 協定正是為此而生 [3]。它提供了一個標準化的框架,讓開發者可以將本地資料(如 SQL 資料庫、Markdown 筆記)或遠端服務封裝成 AI 可讀取的 Resources 與可執行的 Tools。這使得 AI 無需針對每個 App 撰寫特定的驅動程式,而是透過 MCP 進行標準化對話。
2.2.3 本地優先與靈魂檔案 (Local-first & Soul File)
未來的 AI 革命將發生在本地端。Peter Steinberger 提出的「soul.md(靈魂檔案)」概念,代表了 AI 的性格、價值觀與個人記憶應儲存在使用者的本地檔案系統中 [2]。當 AI 與 API 對話時,它會參考這些本地上下文,確保執行結果符合使用者的個人偏好,同時保障了隱私安全。
3. Prerequisites
要建構一個能讓 AI 與 API 自由對話的系統,開發者需要準備以下基礎設施:
- 支援 Tool Calling 的 LLM:如 Claude 3.5 Sonnet 或 GPT-4o,這些模型具備良好的指令遵循能力,能精確生成 API 調用所需的 JSON 參數。
- MCP Server 架構:建立一個符合 MCP 規範的伺服器,用來暴露本地數據或封裝外部 API。
- 結構化的 API 文件:AI 需要清晰的描述(Description)來理解每個 API 的用途、參數類型及約束條件。
- 本地數據環境:如 Markdown 檔案、SQLite 或本地運行的服務,供 AI 代理人存取與操作。
4. Implementation / Workflow Example
以下展示一個典型的「AI 與 API 對話」工作流,模擬 AI 如何自動處理一個跨 App 的任務。
4.1 情境模擬
使用者需求:「我這週在高爾夫球場花了太多錢,幫我把明天的教練課取消,並在記帳軟體中標記預算超支。」
4.2 執行步驟拆解
- 數據檢索 (Resource Access):AI 透過 MCP 讀取本地的
expenses.db,確認本週的高爾夫相關支出。 - 決策推理 (Reasoning):AI 判斷支出已超過設定的閾值,決定執行使用者的取消請求。
- API 對話 (Tool Execution):
- 調用 Calendar API:搜尋明天的「高爾夫教練課」事件並執行
deleteEvent。 - 調用 Accounting API:新增一筆備註為「預算警告」的記錄。
- 調用 Calendar API:搜尋明天的「高爾夫教練課」事件並執行
- 結果回饋:AI 回報:「已為您取消明天的課程並更新記帳系統。建議下週減少休閒支出。」
4.3 程式碼範例:定義 AI 友善的工具 (TypeScript)
在 MCP 模式下,我們不再撰寫 UI,而是撰寫讓 AI 理解的工具定義:
// 定義一個讓 AI 能夠操作行事曆的工具
const cancelAppointmentTool = {
name: "cancel_appointment",
description: "取消指定的預約課程或會議",
inputSchema: {
type: "object",
properties: {
appointmentName: {
type: "string",
description: "要取消的課程名稱,例如 '高爾夫教練課'",
},
date: {
type: "string",
description: "日期格式為 YYYY-MM-DD",
},
},
required: ["appointmentName", "date"],
},
};
// AI 執行時會生成的 JSON 請求
// {
// "tool": "cancel_appointment",
// "parameters": { "appointmentName": "高爾夫教練課", "date": "2026-02-14" }
// }
5. Parameters / API Reference
在 AI 與 API 對話的範式中,API 的設計重點從「人類易讀」轉向「AI 易於推理」。
5.1 MCP 核心互動參數
| 參數類別 | 描述 | 對 AI 的意義 |
|---|---|---|
| Resources | 唯讀的資料源(如檔案、資料庫內容)。 | 提供 AI 決策所需的背景知識與事實。 |
| Tools | 可執行的功能(如發送郵件、修改資料)。 | 賦予 AI 改變現實世界狀態的能力。 |
| Prompts | 預設的互動模板。 | 引導 AI 以特定的角色或邏輯進行對話。 |
5.2 工具描述最佳實踐 (Tool Description Guidelines)
AI 依賴描述來決定何時調用工具。高品質的描述應包含:
- 明確的動詞:如
create,delete,calculate。 - 適用場景:說明此工具解決什麼問題。
- 約束條件:例如「僅限於處理 2024 年後的數據」。
6. Notes & Best Practices
- 從「介面思維」轉向「工具思維」:未來成功的開發者將不再是設計精美的按鈕,而是設計強大、穩定且描述清晰的 API 集合。
- API 的顆粒度控制:避免設計過於複雜的萬能 API。AI 更擅長組合多個功能單一、邊界清晰的小型工具。
- 實作「人類授權層」:對於敏感操作(如賣出股票、刪除重要檔案),必須在 API 層級或 MCP 伺服器中實作確認機制,這就是企業最在乎的安全性 [4]。
- 數據的結構化與標準化:AI 對於混亂的數據解析成本極高。維持本地數據(如 Markdown 筆記)的良好結構,能顯著提升 AI 與 API 對話的準確度。
7. 為什麼選擇這種方式?
選擇推動從人機互動轉向 AI 與 API 的對話,是基於對未來軟體生態的深刻洞察:
- 消除數據孤島 (Breaking Data Silos):傳統 App 將數據鎖在各自的 UI 背後。透過 AI 代理人與 API 直接對話,數據可以在不同服務間自由流動與編排,真正實現以使用者為中心的資訊整合。
- 極致的生產力釋放:人類不再需要學習數百種 App 的操作方式。當 AI 承擔了所有「管理數據」的繁瑣工作時,人類可以回歸到更高層次的創造與決策。
- 隱私與效能的平衡:本地優先的架構確保了最敏感的「靈魂數據」留在使用者身邊,而 AI 則作為一個受信任的代理,代表使用者去與外部 API 進行必要的對話。
- 因應「App 消失」的浪潮:當 80% 的功能性 App 轉化為後端服務時,具備「AI 對話能力」的 API 將成為軟體公司存活的唯一憑證。
這不僅是一場技術的更迭,更是一場關於「我們如何定義軟體」的哲學革命。
參考資料
- [1] Meet 創業小聚. (2026, February 12). 「80%的App將消失!」YC專訪OpenClaw創辦人:AI革命不在雲端,而在你電腦裡. Retrieved from https://meet.bnext.com.tw/articles/view/53052
- [2] Peter Steinberger. (2025). OpenClaw: The Local-first AI Agent Revolution. GitHub Repository.
- [3] Anthropic. (2024, November). Introducing the Model Context Protocol (MCP). Retrieved from https://www.anthropic.com/news/model-context-protocol
- [4] Microsoft. (2025). Semantic Kernel: Integrating Native and Semantic Functions for Agentic Workflows.