GPT-5.5正式登場：OpenAI聯手NVIDIA開啟AI代理人與數位勞動力新時代

2026-04-25

openai-gpt-5-5-nvidia-gb200-ai-agentic-ai-codex — 觀view製圖

【觀view AI前沿】OpenAI正式推出新一代模型GPT-5.5與GPT-5.5 Pro，將AI從單純問答工具推向能自主規劃、操作軟體、撰寫程式、分析資料與協助科學研究的「代理型AI」。與此同時，NVIDIA已讓超過1萬名員工透過Codex率先使用GPT-5.5，並部署於GB200 NVL72機架級系統，展示AI代理人在企業場景中的實戰價值。這不只是模型能力升級，更可能是AI從工具化走向數位勞動力化的關鍵分水嶺。

截至2026年4月25日，OpenAI與NVIDIA相繼公布的新資訊顯示，GPT-5.5不只是一次大型語言模型的常規升級，而是OpenAI將AI從「回答問題」推進到「執行任務」的重要節點。根據OpenAI官方發布的〈Introducing GPT-5.5〉，GPT-5.5被定位為「更聰明、也更直覺易用」的新一代模型，重點能力集中在代理式編程、電腦操作、知識工作與早期科學研究。NVIDIA也在官方部落格證實，OpenAI Codex目前已由GPT-5.5驅動，並在NVIDIA GB200 NVL72機架級系統上運行，已有超過1萬名NVIDIA員工導入使用，涵蓋工程、產品、法務、行銷、財務、銷售、人資、營運與開發者計畫等部門。

從「問答模型」到「能持續工作的代理人」

過去幾年的AI競爭，主軸多半圍繞模型是否回答得更準、是否能解更難的數學題、是否具備更長上下文理解能力。但GPT-5.5的核心賣點已不再只是「更會回答」，而是更像能被委派任務的數位工作者。OpenAI在公告中指出，GPT-5.5能夠處理模糊、多步驟且需要跨工具協作的任務：它可以規劃、使用工具、檢查自身輸出、在不確定情境中持續推進，並在任務完成前跨越不同軟體與資料環境。

這意味著AI的操作方式正在改變。使用者不必再像過去一樣，把複雜任務拆成十幾個提示詞，逐步要求模型輸出、修正、再輸出；相反，使用者可以給出較高層級的目標，例如「分析這些財務資料、建立報告、生成簡報、檢查異常並提出行動建議」，模型則負責拆解流程並推動執行。這種轉變正是「Agentic AI」的核心：模型不只是語言產生器，而是能在工具環境中採取行動的任務代理人。

程式開發：GPT-5.5成為OpenAI最強代理式編程模型

在軟體工程領域，GPT-5.5的提升最為明顯。OpenAI稱其為目前最強的代理式編程模型之一。在Terminal-Bench 2.0這項測試複雜命令列工作流、需要計畫、迭代與工具協調能力的基準中，GPT-5.5達到82.7%的準確率，明顯高於GPT-5.4的75.1%，也高於公告中列出的Claude Opus 4.7與Gemini 3.1 Pro。至於SWE-Bench Pro，GPT-5.5達到58.6%。需要注意的是，OpenAI表格中Claude Opus 4.7在該項目為64.3%，因此GPT-5.5在這個公開基準上並非全面領先所有競品，但相較GPT-5.4的57.7%仍有進步。

真正值得關注的不是單一分數，而是GPT-5.5在長週期、跨檔案、需理解系統架構的開發任務上更可靠。OpenAI引用早期測試者案例指出，GPT-5.5能理解大型程式碼庫中的依賴關係，推測修正會影響哪些模組，並主動補上測試與驗證步驟。MagicPath執行長Pietro Schirano的案例中，GPT-5.5在約20分鐘內處理一個包含數百項前端與重構變更的分支合併，並一次性解決衝突。這類能力使AI不再只是「幫工程師寫幾段程式碼」，而更像一名能接手重構、除錯、測試與驗證流程的協作者。

Codex與「電腦操作」：AI開始真的使用軟體

GPT-5.5的另一項關鍵進展，是與Codex結合後的電腦使用能力。OpenAI表示，GPT-5.5在Codex中不只可生成程式碼，也更擅長產生文件、試算表與簡報，並能透過電腦使用能力看見螢幕、點擊、輸入、導航介面，跨工具完成任務。這一點對企業工作流尤其重要，因為大多數白領工作不是單純問答，而是大量跨系統操作：查資料、比對文件、填表、產出報告、觸發流程、更新資料庫，最後通知相關人員。

OpenAI也披露，公司內部已有超過85%的員工每週使用Codex，場景不只限於軟體工程，也包括財務、行銷、資料科學、產品管理與公關溝通。例如財務團隊使用GPT-5.5協助審閱24,771份K-1稅務表格、總計71,637頁文件，在排除個資的流程中比往年提前約兩週完成；Go-to-Market團隊則透過自動化週報節省每週5至10小時。這些案例顯示，GPT-5.5的價值不只在「寫程式」，而是在將高摩擦、高重複性的知識工作流程代理化。

科學研究：從資料整理走向「共同科學家」

在科學領域，GPT-5.5的定位更具野心。OpenAI指出，GPT-5.5在GeneBench與BixBench等生物資訊與量化生物學相關基準中有明顯進步。GeneBench聚焦多階段科學資料分析，要求模型處理模糊或含錯資料、面對隱藏混雜因素、處理品質控制失敗，並正確實作與解讀統計方法。OpenAI表格顯示，GPT-5.5在GeneBench得分25.0%，高於GPT-5.4的19.0%；GPT-5.5 Pro則達33.2%。BixBench方面，GPT-5.5為80.5%，高於GPT-5.4的74.0%。

更具象徵性的案例，是OpenAI稱內部版本GPT-5.5搭配客製化工具鏈，協助發現一項關於非對角拉姆齊數的漸近事實新證明，並經Lean形式化驗證。拉姆齊數屬於組合數學中的核心難題，研究的是在足夠大的離散結構中，某種秩序何時必然出現。若該案例經學術社群進一步審查與接受，將代表AI不只是在「讀論文、整理資料」，而開始能提出可驗證、具新意的數學推論。

不過，這也需要保持審慎。科學研究不同於程式碼生成，錯誤推論可能在表面上極具說服力，卻在細節上失效。因此GPT-5.5更合理的定位，是加速假說生成、資料分析、工具實作與文獻推理的「共同科學家」，而非取代人類審稿、實驗驗證與學術共識形成。

NVIDIA導入：1萬名員工與GB200 NVL72背後的企業樣板

NVIDIA的官方說法使GPT-5.5發布具備了更強的產業示範意義。NVIDIA指出，OpenAI Codex目前由GPT-5.5驅動，模型運行於NVIDIA GB200 NVL72機架級系統；超過1萬名NVIDIA員工已使用GPT-5.5版Codex。NVIDIA稱，在GB200 NVL72上提供服務，相較前代系統可達成每百萬token成本降低35倍、每兆瓦每秒token輸出提升50倍的推論經濟性。這些數字凸顯，企業級AI代理人能否大規模落地，關鍵不只在模型能力，也在推論成本、能效與系統穩定性。

NVIDIA內部導入也特別強調安全性。根據NVIDIA官方部落格，Codex代理人可透過安全SSH連線到核准的雲端虛擬機，讓代理人在隔離沙盒中處理真實公司資料；部署採用零資料保留政策，對生產系統則以唯讀權限存取，並透過命令列與內部Skills工具層執行工作。這種架構反映企業導入AI代理人的核心矛盾：代理人若權限太低，價值有限；權限太高，又可能引發資安、資料外洩與誤操作風險。NVIDIA的部署方式，某種程度上提供了一個可供大型企業參考的折衷方案。

OpenAI與NVIDIA的共生關係：模型改進基礎設施，基礎設施再推動模型

GPT-5.5發布也揭示OpenAI與NVIDIA更深層的共生關係。NVIDIA表示，雙方合作可追溯至2016年黃仁勳親自將第一台DGX-1 AI超級電腦交付OpenAI。近年雙方更在模型、硬體、推論框架與大規模叢集上密切合作。NVIDIA提到，OpenAI已承諾部署超過10GW的NVIDIA系統作為下一代AI基礎設施；雙方也共同完成第一個GB200 NVL72、10萬GPU叢集的啟動，並完成多次大規模訓練。

OpenAI公告中還提到一個值得玩味的細節：GPT-5.5本身協助改進了承載它的推論基礎設施。例如，Codex分析數週生產流量模式後，撰寫客製化啟發式演算法，用於更佳的負載分配與分區，使token生成速度提升超過20%。這代表AI不只是消耗算力，也開始反過來優化算力系統。若這種循環持續擴大，AI產業可能進入「模型提升基礎設施，基礎設施再提升模型」的正回饋螺旋。

價格、開放範圍與安全限制

商業化方面，OpenAI表示GPT-5.5已向ChatGPT與Codex的Plus、Pro、Business、Enterprise等用戶推出；GPT-5.5 Pro則面向Pro、Business與Enterprise用戶。Codex中的GPT-5.5提供400K上下文視窗，API版本則提供最高1M上下文視窗。根據OpenAI價格頁，GPT-5.5 API價格為每100萬輸入token 5美元、快取輸入0.5美元、輸出30美元；GPT-5.5 Pro則預計為每100萬輸入token 30美元、輸出180美元。

安全方面，GPT-5.5因具備更強的網路安全與生物／化學相關能力，被OpenAI在Preparedness Framework中列為「High」等級。OpenAI稱其尚未達到Critical網路安全能力層級，但已相較GPT-5.4更進一步，因此部署了更嚴格的分類器與風險控制。OpenAI也擴大「Trusted Access for Cyber」計畫，讓通過驗證的防禦者、關鍵基礎設施保護單位在更低摩擦下使用較高能力模型進行合法防禦工作。

產業影響：AI工具化結束，AI勞動力化開始

GPT-5.5最重要的意義，可能不是某個基準提高了幾個百分點，而是AI產品的使用邏輯正在改變。過去，ChatGPT像一個知識豐富的助理，使用者提出問題，它給出答案；現在，GPT-5.5加上Codex更像一個能被分派工作的初階到中高階數位員工，能在限定環境中讀資料、寫程式、操作工具、產出成果並檢查錯誤。

這將對軟體開發、生技製藥、金融分析、企業營運與知識管理帶來深遠影響。短期內，它會提高高技能員工的產出，讓小團隊完成過去需要更大團隊才能承擔的工作；中期則可能重塑企業職位設計，許多工作會從「親手執行」轉向「定義任務、監督代理人、驗證結果」；長期來看，誰能掌握安全、可審計、可控的AI代理人部署方式，誰就可能在效率競爭中取得結構性優勢。

但風險同樣真實。代理人越能操作電腦、讀寫程式碼、尋找漏洞、分析生物資料，越需要嚴格的權限管理、審計紀錄、沙盒隔離與人類覆核。GPT-5.5展示了AI代理人的巨大潛力，也同時提醒產業：真正的AI勞動力不只是模型能力問題，更是治理、資安、責任歸屬與組織流程重構問題。

總結來看，GPT-5.5不是單純的聊天機器人升級，而是OpenAI把AI帶向「能工作、能操作、能研究、能改善自身基礎設施」的一次重大推進。NVIDIA萬名員工的先行部署，則讓這場發布不再只是實驗室展示，而成為大型企業導入AI代理人的實戰樣板。AI前沿的下一階段，競爭焦點將不只是誰的模型更聰明，而是誰能把模型、工具、硬體、資安與工作流程整合成真正可規模化的數位勞動力。

洞察全球大事｜挖掘中南海內幕｜紅朝真相｜川普2.0｜深度觀察｜獨家分析｜追蹤AI前沿｜娛樂｜時尚｜奇聞異事｜養生熱話｜真實信息小棧

GPT-5.5正式登場：OpenAI聯手NVIDIA開啟AI代理人與數位勞動力新時代

從「問答模型」到「能持續工作的代理人」

程式開發：GPT-5.5成為OpenAI最強代理式編程模型

Codex與「電腦操作」：AI開始真的使用軟體

科學研究：從資料整理走向「共同科學家」

NVIDIA導入：1萬名員工與GB200 NVL72背後的企業樣板

OpenAI與NVIDIA的共生關係：模型改進基礎設施，基礎設施再推動模型

價格、開放範圍與安全限制

產業影響：AI工具化結束，AI勞動力化開始

版權聲明

🛡️ 支持獨立發聲 · 守護真相

返回首頁 · HOME

2026世界盃奪冠預測｜姆巴佩破紀錄法國奪冠概率有多高？

哈蘭德絕殺破宿命！挪威2比1淘汰象牙海岸晉級世界盃16強硬撼巴西

中共21大預測全面失靈接班人位置才是真正的關鍵信號

「放假啦!」巴拉圭點球掀翻德國總統三連發嗨爆全網

郭文貴判囚30年：從「反共鬥士」到階下囚法院為何下此重手？

北京中國尊驚傳撞機！小飛機直撲CBD核心距中南海僅7公里 3大疑點

LEAVE A REPLY Cancel reply

獨家重磅

鐵拳教育｜Netflix現象級韓劇爆紅橫掃46國真相戳破全球校園教育傷痛

【習氏家族財富檔案 II】齊橋橋：習氏王朝的「大家長」與隱形財富帝國的操盤手

【習氏家族財富檔案 III】齊安安：軍方姻親、新郵通信、深圳大唐與哈德森基金——習家最隱秘的一條暗線

【習氏家族財富檔案 I】御弟習遠平：習氏紅色帝國的影子柱石

習遠平的秘密花園：從張瀾瀾到景甜紅牆之內一座從未對外開放的權力後院

驚爆！英國首相座車遭裝中共追蹤器持續送資料國會4年後才知情

黎曉宏被查震動北京王岐山五大核心親信全數出局習近平為21大連任清場？

王忠林去向全網最深解析：政治死緩、刀把子接班與彭麗媛山東幫崩塌｜中共21大內幕

瑪麗蓮·夢露死因之謎：誕辰百年為何60多年仍無定論？

VPN選擇困難？專為全球華人打造的極速穩定安全方案

🎯 四大核心優勢

💡 3分鐘快速上手（官網雖為英文，但超簡單）

洞察全球大事｜挖掘中南海內幕｜紅朝真相｜川普2.0｜深度觀察｜獨家分析｜追蹤AI前沿｜娛樂｜時尚｜奇聞異事｜養生熱話｜真實信息小棧

GPT-5.5正式登場：OpenAI聯手NVIDIA開啟AI代理人與數位勞動力新時代

從「問答模型」到「能持續工作的代理人」

程式開發：GPT-5.5成為OpenAI最強代理式編程模型

Codex與「電腦操作」：AI開始真的使用軟體

科學研究：從資料整理走向「共同科學家」

NVIDIA導入：1萬名員工與GB200 NVL72背後的企業樣板

OpenAI與NVIDIA的共生關係：模型改進基礎設施，基礎設施再推動模型

價格、開放範圍與安全限制

產業影響：AI工具化結束，AI勞動力化開始

版權聲明

🛡️ 支持獨立發聲 · 守護真相

LEAVE A REPLY Cancel reply

訂閱《觀View》電子報

獨家重磅

VPN選擇困難？專為全球華人打造的極速穩定安全方案

🎯 四大核心優勢

💡 3分鐘快速上手（官網雖為英文，但超簡單）