Skip to content

Instantly share code, notes, and snippets.

@nczz
Last active April 17, 2026 06:09
Show Gist options
  • Select an option

  • Save nczz/275563ea2178782d8f022d7d34f853b3 to your computer and use it in GitHub Desktop.

Select an option

Save nczz/275563ea2178782d8f022d7d34f853b3 to your computer and use it in GitHub Desktop.
全球主要 AI 模型供應商總覽(2026 年 4 月)

全球主要 AI 模型供應商總覽(2026 年 4 月)

一、供應商背景與推出模型的動機

1. OpenAI(美國,2015 年成立)

  • 背景:最初由 Elon Musk、Sam Altman 等人以非營利組織形式成立,目標是確保 AGI 安全地造福人類。後轉型為「有限營利」結構以吸引資金,Microsoft 為最大投資方。
  • 為何推出模型:2022 年底 ChatGPT 爆紅,證明了 LLM 的商業價值。OpenAI 從研究機構轉為 AI 平台公司,率先定義了「通用 AI 助手」市場。先發優勢 + 最大的開發者生態系是核心護城河。

2. Anthropic(美國,2021 年成立)

  • 背景:由 OpenAI 前研究副總裁 Dario Amodei 與其姊 Daniela Amodei 帶領 7 名研究員出走創立。主要投資方包括 Amazon、Google。
  • 為何推出模型:創辦團隊認為 OpenAI 過度追求商業化,忽視 AI 安全。Anthropic 的核心理念是「安全優先的 AI 開發」,以 Constitutional AI(憲法式 AI)方法訓練模型,強調可控性與可靠性。切入點是成為企業級 AI 的首選。

3. Google DeepMind(美國/英國,合併自 Google Brain + DeepMind)

  • 背景:Google 是 Transformer 架構的發明者(2017 "Attention Is All You Need"),擁有最深厚的 AI 研究底蘊。2023 年將 Google Brain 與 DeepMind 合併為 Google DeepMind。
  • 為何推出模型:ChatGPT 上線後,Google 搜尋業務面臨生存級威脅。Gemini 系列是 Google 的戰略反擊——將 AI 嵌入搜尋、雲端、Android、Workspace 等全產品線,靠生態整合與超大 context window 差異化。

4. Meta(美國,Llama 系列)

  • 背景:全球最大社群媒體公司(Facebook、Instagram、WhatsApp),由 Mark Zuckerberg 領導。
  • 為何推出模型:Meta 選擇開源策略,理由是:(1) 不想依賴 OpenAI/Google 的 API,需要自主 AI 能力驅動廣告推薦與內容生成;(2) 透過開源 Llama 建立社群生態,讓全球開發者幫忙改進模型;(3) 開源可削弱閉源競爭者的定價能力。

5. xAI(美國,2023 年成立)

  • 背景:由 Elon Musk 創立,團隊成員多來自 OpenAI、DeepMind、Google。Musk 原是 OpenAI 共同創辦人,後因方向分歧離開。
  • 為何推出模型:Musk 認為 OpenAI 等主流 AI 公司存在政治偏見(所謂「過度 woke」),xAI 的定位是打造「更少審查、追求真相」的 AI。Grok 深度整合 X(前 Twitter)平台的即時資料,主打即時資訊存取能力。

6. Mistral AI(法國,2023 年成立)

  • 背景:由三位法國 AI 研究者創立——Arthur Mensch、Guillaume Lample、Timothée Lacroix,均為 Google DeepMind 與 Meta AI 前員工。估值約 €117 億。
  • 為何推出模型:歐洲唯一能與美國 AI 巨頭正面競爭的公司。核心訴求是 (1) 歐洲資料主權(符合 GDPR 等法規需求);(2) 開源/開放權重模型,讓企業可自行部署;(3) 以更少算力達到高性能,強調成本效率。

7. DeepSeek(中國,2023 年成立)

  • 背景:由中國量化對沖基金幻方量化(High-Flyer)創辦人梁文鋒成立,總部在杭州。
  • 為何推出模型:2025 年初 DeepSeek-R1 震驚全球——以極低訓練成本達到頂級性能。動機是 (1) 在美國晶片出口管制下,證明中國可以用更少算力做出強模型;(2) 開源策略吸引全球開發者;(3) 幻方量化本身需要強推理能力支撐量化交易研究。

8. Alibaba Cloud / 通義(中國,Qwen 系列)

  • 背景:阿里巴巴集團旗下雲端事業,中國最大公有雲供應商。
  • 為何推出模型:(1) Qwen 是阿里雲 AI 平台的核心引擎,用模型帶動雲端業務營收;(2) 原生中英雙語能力,瞄準亞太市場;(3) 在美國晶片管制下,以效率優化(更低成本、更高吞吐量)作為差異化競爭策略;(4) 開源策略建立開發者生態。

二、模型產品分類與等級對照表

每家供應商基本上都依循「三層架構」:旗艦(最強)→ 均衡(性價比)→ 輕量(低成本高速)。

等級 OpenAI Anthropic Google Meta xAI Mistral DeepSeek Alibaba
旗艦 GPT-5.4 Claude Opus 4.7 Gemini 3.1 Pro Llama 4 Behemoth Grok 4.20 Mistral Large 3 DeepSeek-V3.2 Qwen 3.5 (397B)
均衡 GPT-5.4 mini Claude Sonnet 4.6 Gemini 3 Flash Llama 4 Maverick Grok 4 Mistral Medium 3.1 DeepSeek-V3.1 Qwen 3.5-Flash
輕量 GPT-5.4 nano Claude Haiku 4.5 Gemini 3.1 Flash-Lite Llama 4 Scout Grok 3 mini Mistral Small 4 DeepSeek-V3 Qwen 3 Turbo
推理專用 GPT-5.4 (reasoning) Sonnet 4.6 extended thinking Gemini thinking Grok 4.20 (內建) Magistral Medium 1.2 DeepSeek-R1-0528 QwQ

各等級適用場景

等級 適合什麼 成本 延遲
旗艦 複雜推理、長文分析、高風險決策、研究 較慢
均衡 日常開發、客服、內容生成、大多數生產環境 適中
輕量 分類、摘要、高吞吐量批次處理、即時回應
推理專用 數學、程式碼、邏輯推理、規劃等需要「慢思考」的任務 慢(刻意思考)

三、AI 推論與平台服務層

模型供應商負責「造模型」,但企業實際部署時,還需要一層「跑模型」的基礎設施。這個維度的玩家可分為三類:

3.1 專用晶片推論平台(Custom Silicon)

這類公司自研非 GPU 晶片,專為 AI 推論設計,主打極致速度。

供應商 晶片架構 背景與動機 核心優勢 現況
Groq LPU(Language Processing Unit) 2016 年由 Google TPU 設計者 Jonathan Ross 創立。他認為 GPU 並非推論最佳架構,AI 不應被少數巨頭壟斷。2025 年底被 NVIDIA 以約 $200 億收購,GTC 2026 發表 Groq 3 LPX 整合至 Vera Rubin 平台。 確定性延遲、極低 TTFT(首 token 時間)、即時對話級速度 已併入 NVIDIA,技術整合至 NVIDIA 推論產品線
Cerebras WSE(Wafer-Scale Engine) 2015 年由 SeaMicro 創辦團隊(Andrew Feldman 等)成立。打造整片晶圓大小的單一晶片,挑戰「晶片必須切割」的半導體傳統。2026 年 3 月與 AWS 達成多年合作,進駐 Amazon Bedrock。估值 $230 億。 最高原始吞吐量(~3000 tokens/sec)、晶圓級運算、適合大批量推論 計畫 2026 Q2 IPO,已與 OpenAI 簽下 $100 億算力合約
SambaNova RDU(Reconfigurable Dataflow Unit) 2017 年由史丹佛大學研究者創立。設計可重組資料流架構,不做量化也能維持精度。 單一系統可同時跑多個大模型、無量化精度損失 主攻企業私有部署市場

3.2 GPU 推論平台(開源模型託管)

這類公司用 NVIDIA GPU 叢集託管開源模型,提供 API 服務,競爭重點是速度、價格和模型豐富度。

供應商 成立 背景與動機 核心優勢 支援模型
Together AI 2022 由史丹佛教授 Chris Re、Percy Liang 等人創立(FlashAttention 發明團隊)。目標是打造開源 AI 的原生雲端,讓企業不必依賴閉源 API。 推論 + 微調 + 訓練一站式、FlashAttention 原生優化、GPU 叢集自助服務 Llama、Qwen、DeepSeek、Mistral 等主流開源模型
Fireworks AI 2022 由 Meta PyTorch 核心團隊成員創立。看到企業部署 AI 的推論瓶頸,專注解決「跑得快又便宜」的問題。2025 年 C 輪 $2.5 億,估值 $40 億。 極低延遲、支援自訂模型上傳與微調、企業級 SLA 同上,另支援圖像/語音模型
Replicate 2019 讓開發者用一行程式碼就能跑任何開源模型。降低 AI 部署門檻是核心使命。 最簡單的開發者體驗、按秒計費、支援自訂 Docker 容器 涵蓋 LLM、圖像生成、語音等數千個模型
DeepInfra 2023 專注提供最低成本的開源模型推論 API。 價格極具競爭力、自動擴縮容 主流開源 LLM

3.3 AI 邊緣基礎設施(Edge AI Infrastructure)

供應商 背景與動機 核心產品 定位
Cloudflare 全球最大邊緣網路之一(驅動 20% 網站),2023 年起全面切入 AI 基礎設施。目標是成為 AI 應用的「中介層」——不造模型,而是讓開發者在邊緣高效串接、部署、管理各家模型。 Workers AI(邊緣推論,50+ 開源模型,全球 60+ 節點,<50ms 延遲)、AI Gateway(統一 API 閘道,快取/限流/fallback/可觀測性)、Agents SDK(AI Agent 開發框架 + MCP)、AI Search(RAG 工作流)、Vectorize(向量資料庫)、R2(零出口費儲存) 不是推論平台,而是 AI 應用的邊緣開發平台——把模型推論、Agent 編排、資料儲存、流量管理整合在同一個全球網路上
Akamai 全球最大 CDN 之一,2025/10 推出 Akamai Inference Cloud,2026/3 成為首家全球規模部署 NVIDIA AI Grid 的公司。 Akamai Inference Cloud(4,400+ 邊緣節點部署 NVIDIA RTX PRO 6000 Blackwell GPU,分散式推論編排)。定位是讓企業在靠近使用者的地方跑 AI 推論,特別針對 agentic AI 和物理 AI(自駕、機器人)場景。 硬體級邊緣推論——不只是 serverless API,而是在邊緣節點放 GPU,提供接近本地的推論延遲
Vercel Next.js 創造者,前端部署平台龍頭。2024 年起深度整合 AI 能力。 AI SDK(開源 TypeScript AI 工具包,200 萬+週下載量,支援所有主流模型供應商)、邊緣 AI Gateway、Serverless GPU、Agent 開發框架。AI SDK 6 已支援 Agent、MCP、工具執行審批。 前端/全端開發者的 AI 開發平台——專注讓 Web 應用快速整合 AI 功能並部署到邊緣
Fastly 全球 CDN/邊緣運算平台,2025 年起切入 AI。 Fastly Compute 支援在邊緣跑 AI Agent,強調安全沙箱執行。AI 流量帶動 2025 Q4 營收大幅成長。 安全導向的邊緣 AI 運算——強調在邊緣安全執行 AI Agent,適合對安全性要求高的企業

3.4 雲端 AI 平台(Hyperscaler)

三大公有雲各自建立的 AI 模型市集與託管平台,特色是整合自家雲端生態系。

平台 所屬 背景與動機 核心優勢 可用模型
Amazon Bedrock AWS AWS 本身不做基礎模型,但作為最大公有雲不能缺席 AI 市場。Bedrock 是「模型超市」策略——讓客戶在 AWS 生態內選用任何供應商的模型。 最多模型選擇(Claude、Llama、Mistral、Titan 等)、與 AWS 服務深度整合、Serverless Claude(Anthropic)、Llama、Mistral、Cohere、Stability AI、Cerebras(2026 H2)
Azure AI Microsoft Microsoft 是 OpenAI 最大投資方,Azure AI 是 OpenAI 模型的獨家企業通路。同時也是 Microsoft 365 Copilot 的底層。 OpenAI 模型獨家企業版、與 Microsoft 生態(Office、Teams、GitHub)深度整合、最強企業合規 GPT 系列(獨家)、Llama、Mistral、Phi(微軟自研小模型)
Google Vertex AI Google Cloud Google 需要讓 Gemini 成為企業客戶的首選,Vertex AI 是承載平台。同時也開放第三方模型以避免客戶流失。 Gemini 原生整合、最強 AutoML 工具、與 BigQuery/GCS 無縫串接 Gemini 系列、Claude、Llama、Mistral

3.5 平台選用決策

你的情境 推薦類型 代表
需要極致低延遲(即時對話、語音 AI) 專用晶片平台 Groq(NVIDIA)、Cerebras
用開源模型、要便宜又快 GPU 推論平台 Together AI、Fireworks AI
已在某朵雲上、要整合現有服務 雲端 AI 平台 Bedrock / Azure AI / Vertex AI
想最簡單跑起來、不管基建 GPU 推論平台 Replicate
企業私有部署、資料不出境 專用晶片 or 自建 SambaNova、自架 GPU
AI 應用要部署到全球邊緣、需要 Agent 編排 邊緣 AI 基礎設施 Cloudflare(開發平台)、Akamai(GPU 推論)、Vercel(前端 AI)、Fastly(安全邊緣)

四、AI 應用面分類:依任務類型選工具

除了「通用文字對話」之外,AI 已擴展到多種專門應用領域。以下依應用類型整理主要供應商與工具。

4.1 圖像生成(Text-to-Image)

供應商/工具 背景 核心優勢 開源/閉源
Midjourney V8.1 Alpha 獨立研究實驗室,2022 年成立。創辦人 David Holz 為 Leap Motion 共同創辦人。V7 為目前穩定版,V8.1 Alpha 於 2026/4/14 發表。 美學品質最強、風格化能力無人能及 閉源(Discord / Web)
GPT Image 1.5(OpenAI) 整合於 ChatGPT,取代 DALL-E 3。另有 gpt-image-1-mini 低成本版。 文字渲染最準確、與對話無縫整合 閉源(API)
Flux 2 系列(Black Forest Labs) 由 Stable Diffusion 原始團隊出走創立(德國)。Flux 2 有 max/pro/flex/klein 四個變體。 開源生態最強、速度快(klein 可 sub-second)、寫實品質頂級 開源
Stable Diffusion 3.5(Stability AI) 英國公司,開源圖像生成先驅。有 Large/Turbo/Medium 三版。 社群龐大、可本地運行、高度可客製 開源
Google Nano Banana Pro Google DeepMind 出品,Gemini 3 系列原生圖像模型。另有 Nano Banana 2(高效率版)和 Imagen 4(獨立模型)。 專業 4K 品質、精確文字渲染、整合 Gemini 生態 閉源(API)

選用建議:藝術/行銷素材 → Midjourney;需要精確文字 → GPT Image / Nano Banana Pro;自架/客製 → Flux / Stable Diffusion

4.2 影片生成(Text/Image-to-Video)

供應商/工具 背景 核心優勢
Veo 3.1 / 3.1 Lite(Google DeepMind) Google 旗下,2026 年領先者。Lite 版為低成本開發者版。 原生音訊、電影級品質、與 YouTube 生態整合
Kling 3.0(快手 Kuaishou) 中國短影片平台快手出品,2026/2/5 發表 原生 4K 60fps、多鏡頭分鏡(最多 6 個鏡位)、原生音訊同步
Sora 2(OpenAI) OpenAI 出品,2024 年底發表 物理模擬最真實、角色一致性強
Runway Gen-4.5 美國 AI 影片先驅,2018 年成立。另有 GWM-1 通用世界模型。 最完整的編輯工具鏈、鏡頭控制最精細
Wan 2.7(阿里巴巴) 阿里達摩院出品,2026 年 3-4 月發表 開源影片生成之王、1080p 15 秒、原生音訊、內建推理層
Seedance 2.0(字節跳動 ByteDance) TikTok 母公司出品,2026/2/10 發表 4-15 秒 1080p、多模態輸入、原生音訊、電影級畫質

選用建議:電影級製作 → Veo 3.1;高畫質商業用 → Kling 3.0;開源自架 → Wan 2.7;創意剪輯 → Runway

4.3 語音合成(Text-to-Speech, TTS)

供應商/工具 背景 核心優勢
ElevenLabs Eleven v3 2022 年成立,波蘭/美國。專注語音 AI,被 OpenAI、Anthropic 等採用。另有 Flash v2.5(低延遲版)。 最自然的人聲、聲音複製、70+ 語言、情感表達
OpenAI TTS(gpt-4o-mini-tts) 整合於 OpenAI API。另有 gpt-realtime-1.5 即時語音模型。 高品質且便宜、適合大量使用
Voxtral TTS(Mistral) Mistral AI 出品,40 億參數開源模型,2026 年 3 月發表 開源 TTS 新標竿、人類偏好測試勝率 68.4% vs ElevenLabs
Google Chirp 3 / Gemini TTS Google Cloud 出品。Gemini 3.1 Flash TTS 為最新,另有 2.5 Flash TTS 和 2.5 Pro TTS。 整合 Google 生態、多語言、可控風格
Cartesia Sonic 3 美國新創,專注超低延遲語音 sub-100ms 延遲、即時對話最佳
Amazon Polly AWS 出品 整合 AWS 生態、生成式語音

選用建議:最高品質 → ElevenLabs;大量低成本 → OpenAI TTS;開源自架 → Voxtral;即時對話 → Cartesia

4.4 語音辨識(Speech-to-Text, STT)

供應商/工具 背景 核心優勢
Deepgram Nova-3 2015 年成立,美國。專注語音 AI 基礎設施。 最低錯誤率(WER ~5.7%)、即時串流 sub-250ms、100x 即時批次速度
AssemblyAI Universal-2 2017 年成立,美國。專注開發者友善的語音 API。 WER 8.4%、最強音訊智慧功能(摘要、情感分析、主題偵測)
OpenAI Whisper OpenAI 出品,開源模型 免費開源、99 種語言、可本地運行
ElevenLabs Scribe v2 ElevenLabs 出品,2026/1 發表。另有 Scribe v2 Realtime。 高精度轉錄、與 ElevenLabs 語音生態整合
Mistral Voxtral Transcribe Mistral 出品。Voxtral Mini Transcribe 2(v26.02)和 Realtime 版(開源)。 開源 STT、即時轉錄、歐洲合規
Google Cloud STT Google 出品 整合 Google 生態、Chirp 2 模型
Azure Speech Microsoft 出品 整合 Microsoft 生態、Dragon HD 引擎

選用建議:最高精度 → Deepgram Nova-3;開源自架 → Whisper;音訊分析 → AssemblyAI;歐洲合規 → Voxtral Transcribe

4.5 音樂生成(Text-to-Music)

供應商/工具 背景 核心優勢
Suno v5.5 2023 年成立,美國。估值 $20 億。2026/3/26 發表 v5.5,新增聲音複製和自訂模型。 最快生成(<60 秒)、人聲清晰、最大用戶基數
Udio Allegro v1.5 2023 年成立,美國。前 Google DeepMind 研究者創立。 48kHz 錄音室品質、樂器分離最佳、電子音樂特強
Google Lyria 3 Pro Google DeepMind 出品。另有 Lyria 3 Clip(短片段)和 Lyria RealTime(即時串流)。 整合 YouTube 生態、SynthID 浮水印、即時生成
Stable Audio(Stability AI) Stability AI 出品 開源、開發者可自行部署

選用建議:快速出歌 → Suno;專業音質 → Udio;開源 → Stable Audio

4.6 程式碼助手(AI Code Assistant)

供應商/工具 背景 核心優勢
GitHub Copilot GitHub(Microsoft)出品,2021 年推出 最大市佔、VS Code 原生整合、有免費方案
Cursor 2023 年成立,美國。AI-first 程式碼編輯器。 整個編輯器為 AI 設計、多模型切換、codebase 感知最強
Claude Code(Anthropic) Anthropic 出品的終端 AI 代理 終端原生、自主完成多步驟任務、程式碼品質最高
Windsurf(Codeium) Codeium 出品的 AI 編輯器 平衡性能與價格、企業隱私功能
Kiro(AWS) Amazon 出品的 AI 開發環境 規格驅動開發、與 AWS 生態整合
OpenAI Codex OpenAI 出品的程式碼代理,有 App/IDE/CLI/Web 四種形態 自主完成多步驟任務、沙箱執行、GitHub/Slack 整合
Google Antigravity Google 出品的 AI 程式碼代理 整合 Google 生態、Gemini 模型驅動
Mistral Devstral 2 Mistral 出品的開源程式碼代理 開源、可自架、軟體工程任務特化
Amazon Q Developer AWS 出品 AWS 服務整合最深、企業安全合規

選用建議:VS Code 使用者 → Copilot;全新工作流 → Cursor;終端重度使用者 → Claude Code;AWS 生態 → Kiro / Q Developer

4.7 AI 搜尋(AI-Powered Search)

供應商/工具 背景 核心優勢
Perplexity AI 2022 年成立,美國。前 Google/OpenAI 研究者創立。估值 $200 億。 引用透明、研究級深度搜尋、開發者 API
ChatGPT Search(OpenAI) 整合於 ChatGPT 對話式搜尋、與 GPT 能力無縫結合
Google AI Overviews Google 搜尋內建 最大索引量、整合 Google 全生態
Grok Search(xAI) 整合 X 平台即時資料 即時社群資訊、較少內容審查
Brave Search Brave 瀏覽器出品。自建獨立搜尋索引(不依賴 Google/Bing),AI 功能透過「Answer with AI」和 Leo 助手提供。 隱私優先、自有索引、免費、Search API 供第三方 AI 應用使用
Kagi 2023 年推出,美國。付費搜尋引擎,無廣告。 零追蹤、無廣告、Kagi Assistant 支援深度研究模式

選用建議:研究/學術 → Perplexity;日常搜尋 → Google AI Overviews;隱私優先 → Brave / Kagi;即時社群動態 → Grok

4.8 應用面總覽速查表

應用類型 閉源首選 開源首選 最便宜選項
文字對話 (LLM) GPT-5.4 / Claude Opus 4.7 Llama 4 / Qwen 3.5 DeepSeek-V3.2
圖像生成 Midjourney V8.1 / Nano Banana Pro Flux 2 Pro Stable Diffusion 3.5
影片生成 Veo 3.1 / Kling 3.0 Wan 2.7 Wan 2.7
語音合成 (TTS) ElevenLabs Eleven v3 Voxtral TTS OpenAI TTS
語音辨識 (STT) Deepgram Nova-3 Whisper / Voxtral Transcribe Whisper
音樂生成 Suno v5.5 Stable Audio Suno 免費方案
程式碼助手 Cursor / Claude Code Devstral 2 GitHub Copilot Free
AI 搜尋 Perplexity Pro Perplexity Free

五、快速選用指南:依任務選模型

你的需求 首選 次選
程式碼開發 / Debug Claude Opus 4.7 / Sonnet 4.6 GPT-5.4
通用寫作 / 日常助手 GPT-5.4 Claude Sonnet 4.6
長文件分析(>100K tokens) Gemini 3.1 Pro(2M context) Claude Opus 4.7(1M context)
數學 / 邏輯推理 GPT-5.4 (reasoning xhigh) DeepSeek-R1-0528
成本敏感的大量請求 DeepSeek-V3.2 / Qwen 3 Turbo Gemini 3.1 Flash-Lite
需要自行部署(私有雲/地端) Llama 4 / Mistral / Qwen(開源) DeepSeek(開源)
即時資訊 / 社群數據 Grok 4.20(整合 X 平台) Gemini(整合 Google 搜尋)
歐洲合規 / 資料主權 Mistral 自架 Llama / Qwen
中文 / 亞太市場 Qwen 3.5 DeepSeek-V3
多模態(圖片/影片/語音) Gemini 3.1 Pro GPT-5.4

六、閉源 vs 開源的取捨

閉源(OpenAI / Anthropic / Google) 開源(Meta / Mistral / DeepSeek / Qwen)
優點 性能最強、持續更新、有 SLA 保障 可自架、可微調、無 API 費用、資料不出境
缺點 資料送出、依賴供應商、成本隨用量線性增長 需自建 GPU 基礎設施、維運成本、更新較慢
適合 快速上線、中小規模、不想管基建 資料敏感、大規模推論、需要深度客製

七、產業全景圖

┌─────────────────────────────────────────────────────────────────────┐
│                       AI 產業價值鏈                                  │
├─────────────────────────────────────────────────────────────────────┤
│                                                                     │
│  【模型層】誰在造模型?                                               │
│  ┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐               │
│  │ OpenAI   │ │Anthropic │ │ Google   │ │   xAI    │  ← 閉源       │
│  │ GPT-5.4  │ │Claude 4.7│ │Gemini 3.1│ │ Grok 4.20│               │
│  └──────────┘ └──────────┘ └──────────┘ └──────────┘               │
│  ┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐               │
│  │   Meta   │ │ Mistral  │ │ DeepSeek │ │ Alibaba  │  ← 開源       │
│  │ Llama 4  │ │  Large   │ │   V3/R1  │ │ Qwen 3.5 │               │
│  └──────────┘ └──────────┘ └──────────┘ └──────────┘               │
│                                                                     │
│  【推論層】誰在跑模型?                                               │
│  ┌──────────────────┐ ┌──────────────────┐ ┌──────────────────┐     │
│  │  專用晶片推論      │ │  GPU 推論平台     │ │  雲端 AI 平台     │     │
│  │  Groq (NVIDIA)   │ │  Together AI     │ │  AWS Bedrock     │     │
│  │  Cerebras        │ │  Fireworks AI    │ │  Azure AI        │     │
│  │  SambaNova       │ │  Replicate       │ │  Vertex AI       │     │
│  └──────────────────┘ └──────────────────┘ └──────────────────┘     │
│  ┌──────────────────────────────────────────────────────────────┐    │
│  │  邊緣 AI 基礎設施:Cloudflare / Akamai / Vercel / Fastly   │    │
│  └──────────────────────────────────────────────────────────────┘    │
│                                                                     │
│  【應用層】AI 能做什麼?                                              │
│  ┌────────┐ ┌────────┐ ┌────────┐ ┌────────┐ ┌────────┐ ┌───────┐ │
│  │ 圖像   │ │ 影片   │ │ 語音   │ │ 音樂   │ │ 程式碼  │ │ 搜尋  │ │
│  │Midj/   │ │Veo/    │ │Eleven/ │ │Suno/   │ │Cursor/ │ │Perpl/ │ │
│  │Flux    │ │Kling   │ │Voxtral │ │Udio    │ │Codex   │ │GPT    │ │
│  └────────┘ └────────┘ └────────┘ └────────┘ └────────┘ └───────┘ │
│                                                                     │
│  【使用者層】                                                        │
│  企業應用 ← 開發者 ← SaaS 產品 ← 終端使用者                           │
│                                                                     │
└─────────────────────────────────────────────────────────────────────┘

參考來源

  1. GPT-5.4, Claude 4.6, Gemini - GAIM Solutions
  2. Top 10 AI Models 2026 Complete Ranking - VERTU
  3. What Is xAI? The Company Behind Grok - Built In
  4. From OpenAI Split to Building Claude - Noqta
  5. Mistral AI - AI Wiki
  6. DeepSeek - Wikipedia
  7. Will China lead the agentic AI race with Qwen3.5? - ThinkChina
  8. AI Models 2026: Which Model for Which Use Case? - Gosign
  9. OpenAI vs Anthropic vs Google: Best LLM in 2026? - MarsDevs
  10. AI Inference API Providers Compared (2026) - Infrabase
  11. AI Inference Platforms Compared - Ryan Walker
  12. NVIDIA's $20 Billion Bet: How Groq 3 LPX Is Reshaping AI Inference - AlphaMatch
  13. Cerebras Raises $1.1B at $8.1B Valuation - Cerebras
  14. Together AI Revenue & Market Share 2026 - SIG
  15. Fireworks AI Revenue & Market Share 2026 - SIG
  16. AWS Bedrock vs Google Vertex AI vs Azure AI Studio - Reintech
  17. Enterprise AI Agent Platforms Comparison - Athenic
  18. Best AI Voice Models 2026: 12 TTS Providers Tested - TeamDay
  19. Best Speech-to-Text API in 2026 - TranscribeTube
  20. Kling vs Sora vs Veo vs Runway: 2026 AI Comparison - AdCreate
  21. AI Music Models Compared: Suno vs Udio 2026 - AI Magicx
  22. Best AI Image Generators 2026 - Creative AI News
  23. AI Coding Agents 2026 Comparison - Lush Binary
  24. Perplexity AI Review 2026 - SimilarLabs
  25. Voxtral TTS vs ElevenLabs vs OpenAI TTS - Digital Applied

資料整理時間:2026-04-17(已依各供應商官方網站更新至最新版本) | 內容經改寫整理,非逐字引用原始來源

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment