回到文章列表

【新一代互動領域】介面革命：從「人機互動」轉向「AI 與 API 的對話」

作者:子yee

日期:2026-02-13

1. Overview

在過去的數十年間，人類與軟體的互動始終圍繞著圖形使用者介面（GUI）展開。使用者必須學習每一款軟體的佈局、邏輯與操作路徑，將自己的需求「翻譯」成一系列的點擊與輸入。然而，隨著大型語言模型（LLM）進化為具備主動執行能力的 AI 代理人（AI Agents），我們正處於一場深刻的「介面革命」前夕。這場革命的核心是從「人機互動」轉向「AI 與 API 的對話」[1]。

正如 OpenClaw 創辦人 Peter Steinberger 在近期專訪中所預測，「80% 的應用程式將會消失」[2]。這並非指軟體功能的消亡，而是指作為「資料庫前端」的 App 介面將變得多餘。當 AI 能夠直接理解使用者的自然語言意圖，並透過標準化的協議（如 Model Context Protocol, MCP）直接與後端 API 或本地數據進行對話時，傳統繁瑣的 UI 操作將被無縫的自動化工作流所取代。本文件將深入探討這一轉型的技術架構、核心機制以及開發者應如何應對這場「軟體大滅絕」。

2. Architecture / Design

介面革命的本質是將「操作權」從人類手中移交給 AI，而人類則保留「決策權」與「目標設定權」。這需要一套全新的架構來支撐 AI 代理人與數位世界的互動。

2.1 從 GUI 到 AUI 的演進 (Evolution of Interfaces)

軟體介面的演進可以被視為一個不斷降低「互動摩擦力」的過程：

階段	介面類型	核心特徵	使用者負擔
CLI	命令列介面	需記憶精確指令與參數。	極高：需學習專門語法。
GUI	圖形介面	透過視覺化按鈕與選單引導操作。	中：需學習軟體佈局與邏輯。
LUI	語言介面	透過自然語言對話獲取資訊。	低：直接表達需求，但僅限文字輸出。
AUI	代理介面	AI 主動調用工具/API 完成目標。	極低：設定目標，AI 處理執行細節。

2.2 AI 與 API 對話的核心機制

在 AUI 架構下，AI 不再只是回傳文字，而是成為一個「協調者（Orchestrator）」。其運作依賴於以下三個關鍵環節：

2.2.1 意圖識別與任務編排 (Intent & Planning)

當使用者輸入「幫我分析這週的開支並調整下週的預算」時，AI 首先會將此模糊目標拆解為一系列具體的 API 呼叫步驟。這涉及到對上下文的深度理解，以及對可用「工具（Tools）」的精確匹配。

2.2.2 Model Context Protocol (MCP) 的標準化作用

為了讓 AI 能夠與成千上萬種軟體對話，我們需要一個通用的「插座」。Anthropic 推出的 MCP 協定正是為此而生 [3]。它提供了一個標準化的框架，讓開發者可以將本地資料（如 SQL 資料庫、Markdown 筆記）或遠端服務封裝成 AI 可讀取的 Resources 與可執行的 Tools。這使得 AI 無需針對每個 App 撰寫特定的驅動程式，而是透過 MCP 進行標準化對話。

2.2.3 本地優先與靈魂檔案 (Local-first & Soul File)

未來的 AI 革命將發生在本地端。Peter Steinberger 提出的「soul.md（靈魂檔案）」概念，代表了 AI 的性格、價值觀與個人記憶應儲存在使用者的本地檔案系統中 [2]。當 AI 與 API 對話時，它會參考這些本地上下文，確保執行結果符合使用者的個人偏好，同時保障了隱私安全。

3. Prerequisites

要建構一個能讓 AI 與 API 自由對話的系統，開發者需要準備以下基礎設施：

支援 Tool Calling 的 LLM：如 Claude 3.5 Sonnet 或 GPT-4o，這些模型具備良好的指令遵循能力，能精確生成 API 調用所需的 JSON 參數。
MCP Server 架構：建立一個符合 MCP 規範的伺服器，用來暴露本地數據或封裝外部 API。
結構化的 API 文件：AI 需要清晰的描述（Description）來理解每個 API 的用途、參數類型及約束條件。
本地數據環境：如 Markdown 檔案、SQLite 或本地運行的服務，供 AI 代理人存取與操作。

4. Implementation / Workflow Example

以下展示一個典型的「AI 與 API 對話」工作流，模擬 AI 如何自動處理一個跨 App 的任務。

4.1 情境模擬

使用者需求：「我這週在高爾夫球場花了太多錢，幫我把明天的教練課取消，並在記帳軟體中標記預算超支。」

4.2 執行步驟拆解

數據檢索 (Resource Access)：AI 透過 MCP 讀取本地的 expenses.db，確認本週的高爾夫相關支出。
決策推理 (Reasoning)：AI 判斷支出已超過設定的閾值，決定執行使用者的取消請求。
API 對話 (Tool Execution)：
- 調用 Calendar API：搜尋明天的「高爾夫教練課」事件並執行 deleteEvent。
- 調用 Accounting API：新增一筆備註為「預算警告」的記錄。
結果回饋：AI 回報：「已為您取消明天的課程並更新記帳系統。建議下週減少休閒支出。」

4.3 程式碼範例：定義 AI 友善的工具 (TypeScript)

在 MCP 模式下，我們不再撰寫 UI，而是撰寫讓 AI 理解的工具定義：

// 定義一個讓 AI 能夠操作行事曆的工具
const cancelAppointmentTool = {
  name: "cancel_appointment",
  description: "取消指定的預約課程或會議",
  inputSchema: {
    type: "object",
    properties: {
      appointmentName: {
        type: "string",
        description: "要取消的課程名稱，例如 '高爾夫教練課'",
      },
      date: {
        type: "string",
        description: "日期格式為 YYYY-MM-DD",
      },
    },
    required: ["appointmentName", "date"],
  },
};

// AI 執行時會生成的 JSON 請求
// {
//   "tool": "cancel_appointment",
//   "parameters": { "appointmentName": "高爾夫教練課", "date": "2026-02-14" }
// }

5. Parameters / API Reference

在 AI 與 API 對話的範式中，API 的設計重點從「人類易讀」轉向「AI 易於推理」。

5.1 MCP 核心互動參數

參數類別	描述	對 AI 的意義
Resources	唯讀的資料源（如檔案、資料庫內容）。	提供 AI 決策所需的背景知識與事實。
Tools	可執行的功能（如發送郵件、修改資料）。	賦予 AI 改變現實世界狀態的能力。
Prompts	預設的互動模板。	引導 AI 以特定的角色或邏輯進行對話。

5.2 工具描述最佳實踐 (Tool Description Guidelines)

AI 依賴描述來決定何時調用工具。高品質的描述應包含：

明確的動詞：如 create, delete, calculate。
適用場景：說明此工具解決什麼問題。
約束條件：例如「僅限於處理 2024 年後的數據」。

6. Notes & Best Practices

從「介面思維」轉向「工具思維」：未來成功的開發者將不再是設計精美的按鈕，而是設計強大、穩定且描述清晰的 API 集合。
API 的顆粒度控制：避免設計過於複雜的萬能 API。AI 更擅長組合多個功能單一、邊界清晰的小型工具。
實作「人類授權層」：對於敏感操作（如賣出股票、刪除重要檔案），必須在 API 層級或 MCP 伺服器中實作確認機制，這就是企業最在乎的安全性 [4]。
數據的結構化與標準化：AI 對於混亂的數據解析成本極高。維持本地數據（如 Markdown 筆記）的良好結構，能顯著提升 AI 與 API 對話的準確度。

7. 為什麼選擇這種方式？

選擇推動從人機互動轉向 AI 與 API 的對話，是基於對未來軟體生態的深刻洞察：

消除數據孤島 (Breaking Data Silos)：傳統 App 將數據鎖在各自的 UI 背後。透過 AI 代理人與 API 直接對話，數據可以在不同服務間自由流動與編排，真正實現以使用者為中心的資訊整合。
極致的生產力釋放：人類不再需要學習數百種 App 的操作方式。當 AI 承擔了所有「管理數據」的繁瑣工作時，人類可以回歸到更高層次的創造與決策。
隱私與效能的平衡：本地優先的架構確保了最敏感的「靈魂數據」留在使用者身邊，而 AI 則作為一個受信任的代理，代表使用者去與外部 API 進行必要的對話。
因應「App 消失」的浪潮：當 80% 的功能性 App 轉化為後端服務時，具備「AI 對話能力」的 API 將成為軟體公司存活的唯一憑證。

這不僅是一場技術的更迭，更是一場關於「我們如何定義軟體」的哲學革命。

實作心得

這篇文章的觀點在我自己的日常工作流中得到了很直觀的驗證。一年前，我處理資料的方式還是：打開 Excel、手動下載 CSV、貼到試算表裡算。現在的方式是：告訴 AI 我要分析什麼，AI 直接呼叫 API 拿資料回來，跑完分析後生成報告。整個過程裡，我幾乎沒有碰任何 GUI，全程都是「對話 → API → 結果」。

從開發者角度來看，這個轉變讓我重新評估哪些前端工作真的值得投入。如果一個功能的使用者有 80% 是透過 AI Agent 呼叫的，那花時間做精美的 UI 動畫意義不大，反而應該把精力放在 API 的 schema 設計、錯誤訊息的可讀性、以及 MCP Tool 的 description 寫得夠不夠清楚。這是一個資源分配思維的根本轉變。

不過「介面消失」並非全面的。有些體驗確實需要視覺化 UI——複雜的資料儀表板、設計工具、遊戲——這些場景下 AI 無法取代人眼和直覺判斷。真正會消失的是那些「只是把資料搬來搬去」的 UI，這類工作 AI Agent 確實做得比人類既快又便宜。

參考資料

[1] Meet 創業小聚. (2026, February 12). 「80%的App將消失！」YC專訪OpenClaw創辦人：AI革命不在雲端，而在你電腦裡. Retrieved from https://meet.bnext.com.tw/articles/view/53052
[2] Peter Steinberger. (2025). OpenClaw: The Local-first AI Agent Revolution. GitHub Repository.
[3] Anthropic. (2024, November). Introducing the Model Context Protocol (MCP). Retrieved from https://www.anthropic.com/news/model-context-protocol
[4] Microsoft. (2025). Semantic Kernel: Integrating Native and Semantic Functions for Agentic Workflows.