HomeAI科技前沿GPT-5.5正式登場:OpenAI聯手NVIDIA開啟AI代理人與數位勞動力新時代

GPT-5.5正式登場:OpenAI聯手NVIDIA開啟AI代理人與數位勞動力新時代

【觀view AI前沿】OpenAI正式推出新一代模型GPT-5.5與GPT-5.5 Pro,將AI從單純問答工具推向能自主規劃、操作軟體、撰寫程式、分析資料與協助科學研究的「代理型AI」。與此同時,NVIDIA已讓超過1萬名員工透過Codex率先使用GPT-5.5,並部署於GB200 NVL72機架級系統,展示AI代理人在企業場景中的實戰價值。這不只是模型能力升級,更可能是AI從工具化走向數位勞動力化的關鍵分水嶺。

截至2026年4月25日,OpenAI與NVIDIA相繼公布的新資訊顯示,GPT-5.5不只是一次大型語言模型的常規升級,而是OpenAI將AI從「回答問題」推進到「執行任務」的重要節點。 根據OpenAI官方發布的〈Introducing GPT-5.5〉,GPT-5.5被定位為「更聰明、也更直覺易用」的新一代模型,重點能力集中在代理式編程、電腦操作、知識工作與早期科學研究。NVIDIA也在官方部落格證實,OpenAI Codex目前已由GPT-5.5驅動,並在NVIDIA GB200 NVL72機架級系統上運行,已有超過1萬名NVIDIA員工導入使用,涵蓋工程、產品、法務、行銷、財務、銷售、人資、營運與開發者計畫等部門。

從「問答模型」到「能持續工作的代理人」

過去幾年的AI競爭,主軸多半圍繞模型是否回答得更準、是否能解更難的數學題、是否具備更長上下文理解能力。但GPT-5.5的核心賣點已不再只是「更會回答」,而是更像能被委派任務的數位工作者。OpenAI在公告中指出,GPT-5.5能夠處理模糊、多步驟且需要跨工具協作的任務:它可以規劃、使用工具、檢查自身輸出、在不確定情境中持續推進,並在任務完成前跨越不同軟體與資料環境。

這意味著AI的操作方式正在改變。使用者不必再像過去一樣,把複雜任務拆成十幾個提示詞,逐步要求模型輸出、修正、再輸出;相反,使用者可以給出較高層級的目標,例如「分析這些財務資料、建立報告、生成簡報、檢查異常並提出行動建議」,模型則負責拆解流程並推動執行。這種轉變正是「Agentic AI」的核心:模型不只是語言產生器,而是能在工具環境中採取行動的任務代理人。

程式開發:GPT-5.5成為OpenAI最強代理式編程模型

在軟體工程領域,GPT-5.5的提升最為明顯。OpenAI稱其為目前最強的代理式編程模型之一。在Terminal-Bench 2.0這項測試複雜命令列工作流、需要計畫、迭代與工具協調能力的基準中,GPT-5.5達到82.7%的準確率,明顯高於GPT-5.4的75.1%,也高於公告中列出的Claude Opus 4.7與Gemini 3.1 Pro。至於SWE-Bench Pro,GPT-5.5達到58.6%。需要注意的是,OpenAI表格中Claude Opus 4.7在該項目為64.3%,因此GPT-5.5在這個公開基準上並非全面領先所有競品,但相較GPT-5.4的57.7%仍有進步。

真正值得關注的不是單一分數,而是GPT-5.5在長週期、跨檔案、需理解系統架構的開發任務上更可靠。OpenAI引用早期測試者案例指出,GPT-5.5能理解大型程式碼庫中的依賴關係,推測修正會影響哪些模組,並主動補上測試與驗證步驟。MagicPath執行長Pietro Schirano的案例中,GPT-5.5在約20分鐘內處理一個包含數百項前端與重構變更的分支合併,並一次性解決衝突。這類能力使AI不再只是「幫工程師寫幾段程式碼」,而更像一名能接手重構、除錯、測試與驗證流程的協作者。

Codex與「電腦操作」:AI開始真的使用軟體

GPT-5.5的另一項關鍵進展,是與Codex結合後的電腦使用能力。OpenAI表示,GPT-5.5在Codex中不只可生成程式碼,也更擅長產生文件、試算表與簡報,並能透過電腦使用能力看見螢幕、點擊、輸入、導航介面,跨工具完成任務。這一點對企業工作流尤其重要,因為大多數白領工作不是單純問答,而是大量跨系統操作:查資料、比對文件、填表、產出報告、觸發流程、更新資料庫,最後通知相關人員。

OpenAI也披露,公司內部已有超過85%的員工每週使用Codex,場景不只限於軟體工程,也包括財務、行銷、資料科學、產品管理與公關溝通。例如財務團隊使用GPT-5.5協助審閱24,771份K-1稅務表格、總計71,637頁文件,在排除個資的流程中比往年提前約兩週完成;Go-to-Market團隊則透過自動化週報節省每週5至10小時。這些案例顯示,GPT-5.5的價值不只在「寫程式」,而是在將高摩擦、高重複性的知識工作流程代理化。

科學研究:從資料整理走向「共同科學家」

在科學領域,GPT-5.5的定位更具野心。OpenAI指出,GPT-5.5在GeneBench與BixBench等生物資訊與量化生物學相關基準中有明顯進步。GeneBench聚焦多階段科學資料分析,要求模型處理模糊或含錯資料、面對隱藏混雜因素、處理品質控制失敗,並正確實作與解讀統計方法。OpenAI表格顯示,GPT-5.5在GeneBench得分25.0%,高於GPT-5.4的19.0%;GPT-5.5 Pro則達33.2%。BixBench方面,GPT-5.5為80.5%,高於GPT-5.4的74.0%。

更具象徵性的案例,是OpenAI稱內部版本GPT-5.5搭配客製化工具鏈,協助發現一項關於非對角拉姆齊數的漸近事實新證明,並經Lean形式化驗證。拉姆齊數屬於組合數學中的核心難題,研究的是在足夠大的離散結構中,某種秩序何時必然出現。若該案例經學術社群進一步審查與接受,將代表AI不只是在「讀論文、整理資料」,而開始能提出可驗證、具新意的數學推論。

不過,這也需要保持審慎。科學研究不同於程式碼生成,錯誤推論可能在表面上極具說服力,卻在細節上失效。因此GPT-5.5更合理的定位,是加速假說生成、資料分析、工具實作與文獻推理的「共同科學家」,而非取代人類審稿、實驗驗證與學術共識形成。

NVIDIA導入:1萬名員工與GB200 NVL72背後的企業樣板

NVIDIA的官方說法使GPT-5.5發布具備了更強的產業示範意義。NVIDIA指出,OpenAI Codex目前由GPT-5.5驅動,模型運行於NVIDIA GB200 NVL72機架級系統;超過1萬名NVIDIA員工已使用GPT-5.5版Codex。NVIDIA稱,在GB200 NVL72上提供服務,相較前代系統可達成每百萬token成本降低35倍、每兆瓦每秒token輸出提升50倍的推論經濟性。這些數字凸顯,企業級AI代理人能否大規模落地,關鍵不只在模型能力,也在推論成本、能效與系統穩定性。

NVIDIA內部導入也特別強調安全性。根據NVIDIA官方部落格,Codex代理人可透過安全SSH連線到核准的雲端虛擬機,讓代理人在隔離沙盒中處理真實公司資料;部署採用零資料保留政策,對生產系統則以唯讀權限存取,並透過命令列與內部Skills工具層執行工作。這種架構反映企業導入AI代理人的核心矛盾:代理人若權限太低,價值有限;權限太高,又可能引發資安、資料外洩與誤操作風險。NVIDIA的部署方式,某種程度上提供了一個可供大型企業參考的折衷方案。

OpenAI與NVIDIA的共生關係:模型改進基礎設施,基礎設施再推動模型

GPT-5.5發布也揭示OpenAI與NVIDIA更深層的共生關係。NVIDIA表示,雙方合作可追溯至2016年黃仁勳親自將第一台DGX-1 AI超級電腦交付OpenAI。近年雙方更在模型、硬體、推論框架與大規模叢集上密切合作。NVIDIA提到,OpenAI已承諾部署超過10GW的NVIDIA系統作為下一代AI基礎設施;雙方也共同完成第一個GB200 NVL72、10萬GPU叢集的啟動,並完成多次大規模訓練。

OpenAI公告中還提到一個值得玩味的細節:GPT-5.5本身協助改進了承載它的推論基礎設施。例如,Codex分析數週生產流量模式後,撰寫客製化啟發式演算法,用於更佳的負載分配與分區,使token生成速度提升超過20%。這代表AI不只是消耗算力,也開始反過來優化算力系統。若這種循環持續擴大,AI產業可能進入「模型提升基礎設施,基礎設施再提升模型」的正回饋螺旋。

價格、開放範圍與安全限制

商業化方面,OpenAI表示GPT-5.5已向ChatGPT與Codex的Plus、Pro、Business、Enterprise等用戶推出;GPT-5.5 Pro則面向Pro、Business與Enterprise用戶。Codex中的GPT-5.5提供400K上下文視窗,API版本則提供最高1M上下文視窗。根據OpenAI價格頁,GPT-5.5 API價格為每100萬輸入token 5美元、快取輸入0.5美元、輸出30美元;GPT-5.5 Pro則預計為每100萬輸入token 30美元、輸出180美元。

安全方面,GPT-5.5因具備更強的網路安全與生物/化學相關能力,被OpenAI在Preparedness Framework中列為「High」等級。OpenAI稱其尚未達到Critical網路安全能力層級,但已相較GPT-5.4更進一步,因此部署了更嚴格的分類器與風險控制。OpenAI也擴大「Trusted Access for Cyber」計畫,讓通過驗證的防禦者、關鍵基礎設施保護單位在更低摩擦下使用較高能力模型進行合法防禦工作。

產業影響:AI工具化結束,AI勞動力化開始

GPT-5.5最重要的意義,可能不是某個基準提高了幾個百分點,而是AI產品的使用邏輯正在改變。過去,ChatGPT像一個知識豐富的助理,使用者提出問題,它給出答案;現在,GPT-5.5加上Codex更像一個能被分派工作的初階到中高階數位員工,能在限定環境中讀資料、寫程式、操作工具、產出成果並檢查錯誤。

這將對軟體開發、生技製藥、金融分析、企業營運與知識管理帶來深遠影響。短期內,它會提高高技能員工的產出,讓小團隊完成過去需要更大團隊才能承擔的工作;中期則可能重塑企業職位設計,許多工作會從「親手執行」轉向「定義任務、監督代理人、驗證結果」;長期來看,誰能掌握安全、可審計、可控的AI代理人部署方式,誰就可能在效率競爭中取得結構性優勢。

但風險同樣真實。代理人越能操作電腦、讀寫程式碼、尋找漏洞、分析生物資料,越需要嚴格的權限管理、審計紀錄、沙盒隔離與人類覆核。GPT-5.5展示了AI代理人的巨大潛力,也同時提醒產業:真正的AI勞動力不只是模型能力問題,更是治理、資安、責任歸屬與組織流程重構問題。

總結來看,GPT-5.5不是單純的聊天機器人升級,而是OpenAI把AI帶向「能工作、能操作、能研究、能改善自身基礎設施」的一次重大推進。NVIDIA萬名員工的先行部署,則讓這場發布不再只是實驗室展示,而成為大型企業導入AI代理人的實戰樣板。AI前沿的下一階段,競爭焦點將不只是誰的模型更聰明,而是誰能把模型、工具、硬體、資安與工作流程整合成真正可規模化的數位勞動力。

版權聲明

© 觀view版權聲明:本文原創內容(文字、觀點、分析、製圖等)均受著作權法保護。未經觀view事先書面授權,不得以任何形式轉載、改寫、節錄、翻譯、散布或作商業利用。允許在合理範圍內引用並註明出處,但不得影響原作完整性。違反上述規定者,觀view將依法追究民事與刑事責任。授權申請請洽:[email protected]

🛡️ 支持獨立發聲 · 守護真相

在信息管制日趨嚴格的時代,我們堅持帶來未經審查的深度分析

您的支持將直接用於服務器維護與內容創作

☕ 請我們喝杯咖啡

您的每一份心意都將轉化為更好的內容 💝

LEAVE A REPLY

Please enter your comment!
Please enter your name here

訂閱《觀View》電子報

精選全球時事、中南海深度觀察,幫你快速看懂世界。

獨家重磅

🔒 網路工具推薦 • 長期穩定

VPN選擇困難?專為全球華人打造的極速穩定安全方案

免費與低價VPN往往以犧牲速度甚至出售數據為代價。對於追求極致安全與隱私的您,ExpressVPN是不二之選。採用軍事級AES-256加密與獨家TrustedServer技術,無論是在機場、咖啡廳使用公共Wi-Fi,還是進行加密貨幣交易,都能確保您的數位足跡不被追蹤。這不僅是工具,更是對您網路主權的頂級守護。

🎯 四大核心優勢

🚀
適合長期翻牆使用
Lightway專利協議,封鎖嚴格時期也能穩定連接
🌍
全球節點覆蓋廣泛
105+國家3000+伺服器,一鍵解鎖全球串流內容與服務
🛡️
軍事級加密保護
AES-256加密+嚴格無日誌政策,全面保護您的數位隱私與資產安全
極致穩定連接
支援4K串流和大文件傳輸,拒絕緩衝,極少斷線

💡 3分鐘快速上手(官網雖為英文,但超簡單)

購買流程只需3步,應用程式安裝後可完全切換為中文介面:

  • 點擊下方按鈕 → 選擇12個月方案(最優惠,含額外免費月份)
  • 填寫郵箱付款 → 支援信用卡、PayPal等多種方式
  • 下載應用程式 → 登入後切換為「中文」即可使用
  • 💡 新手建議:第一次使用VPN?可以先選擇 1個月方案試用(僅$12.99),確認好用後再考慮長期方案。反正有30天退款保證!

99.9%
穩定在線率
105+
國家覆蓋
8台
設備同時使用
30天
退款保證
🎯 限時優惠:年費方案可節省69% + 額外贈送3個月
🔗 查看優惠方案並開始使用
30天內不滿意可申請全額退款,無需說明理由
零風險試用保證

📝 透明聲明:本推薦包含聯盟連結。透過本站連結購買,您的價格不會增加,我們可能獲得少量佣金以支持網站運營。我們只推薦經過長期實測(2年+)、表現穩定的工具。