有件大事正在發生 (Something Big Is Happening)
作者:Matt Shumer • 2026 年 2 月 9 日
回想一下 2020 年 2 月。如果你當時密切關注,你可能會注意到有少數人在談論一種在海外蔓延的病毒。但我們大多數人都沒有太在意。當時股市表現良好,你的孩子在學校上課,你去餐廳吃飯、與人握手、計畫旅行。如果有人告訴你他們在囤積衛生紙,你會認為他們在網路上某個奇怪的角落待太久了。接著,在大約三個星期的時間裡,整個世界都變了。你的辦公室關閉,你的孩子回家,生活重新排列成一種如果你在一個月前向自己描述,你絕對不會相信的模樣。
我認為我們現在正處於某件比 Covid 大得多、大得多的事情的「這似乎被誇大了」階段。
我花了六年時間建立一家 AI 新創公司並在該領域進行投資。我生活在這個世界裡。我寫這篇文章是為了我生命中那些不在這個領域的人……我的家人、我的朋友,以及我關心的那些不斷問我「所以 AI 到底怎麼了?」的人。他們得到的答案,根本無法真實反映實際正在發生的事情。我一直給他們客氣的版本、適合雞尾酒會的版本。因為誠實的版本聽起來像是我瘋了。有一段時間,我告訴自己這是一個足夠好的理由,把真正發生的事情藏在心裡。但我一直以來所說的,與實際正在發生的事情之間的差距,已經變得太大了。我關心的人有權聽到即將發生的事情,即使這聽起來很瘋狂。
我應該先聲明一點:儘管我在 AI 領域工作,但我對即將發生的事情幾乎沒有影響力,業界絕大多數人也是如此。未來正由極少數的人塑造:幾家公司(OpenAI、Anthropic、Google DeepMind 以及其他幾家)裡的數百名研究人員。一次由小團隊在幾個月內管理的單一訓練運行,就能產生一個改變整個技術軌跡的 AI 系統。我們這些在 AI 領域工作的大多數人,都是建立在我們沒有奠定的基礎之上。我們和你們一樣看著這一切展開……我們只是剛好靠得夠近,能最先感受到地面的震動。
但現在是時候了。不是那種「我們遲早應該談談這個」的方式,而是「這正在發生,我需要你了解它」的方式。
我知道這是真的,因為它首先發生在我身上
科技界以外的人還不太明白一件事:現在業界之所以有這麼多人發出警告,是因為這已經發生在我們身上了。我們不是在做預測。我們是在告訴你我們自己的工作中已經發生的事情,並警告你,你就是下一個。
多年來,AI 一直在穩步改善。偶爾會有大幅躍進,但每次躍進的間隔夠長,讓你有時間去吸收。然後在 2025 年,構建這些模型的新技術解鎖了更快的進步速度。接著它變得更快,然後又更快。每一個新模型不僅比上一個更好……而且好上一大截,新模型發布之間的間隔也更短了。我越來越多地使用 AI,與它來回修改的次數越來越少,看著它處理我以前認為需要我的專業知識的事情。
接著,在 2 月 5 日,兩家主要的 AI 實驗室在同一天發布了新模型:OpenAI 的 GPT-5.3 Codex,以及 Anthropic(ChatGPT 的主要競爭對手 Claude 的開發商)的 Opus 4.6。然後某種東西被觸發了。這不像打開電燈開關……更像是你意識到水已經在你周圍上漲,現在已經淹到你的胸口的那一刻。
我的工作不再需要我進行實際的技術操作。我用白話文描述我想構建的東西,然後它就……出現了。不是一個需要我修復的草稿,而是成品。我告訴 AI 我想要什麼,離開電腦四個小時,回來時發現工作已經完成了。做得很好,做得比我自己做的還要好,不需要任何修改。幾個月前,我還在與 AI 來回溝通、引導它、進行編輯。現在我只描述結果,然後離開。
讓我給你舉個例子,好讓你了解這在實際中是什麼樣子。我會告訴 AI:「我想構建這個應用程式。這是它應該做的事,這是它大概應該長成的樣子。把使用者流程、設計等所有細節都搞定。」它就照做了。它寫了幾萬行程式碼。然後——這是大約一年前根本無法想像的部分——它自己打開了應用程式。它點擊按鈕。它測試功能。它像人一樣使用這個應用程式。如果它不喜歡某個東西的外觀或感覺,它會自己回去修改。它像開發人員一樣進行迭代、修復和完善,直到它滿意為止。只有當它決定這個應用程式符合它自己的標準時,它才會回來告訴我:「準備好讓你測試了。」而當我測試時,它通常是完美的。
我沒有誇張。這就是我這個星期一的工作情況。
但最讓我震驚的,是上週發布的模型(GPT-5.3 Codex)。它不只是在執行我的指令。它在做出明智的決定。它擁有一種第一次感覺像是「判斷力」的東西。像是「品味」。那種人們總是說 AI 永遠不會具備的、知道什麼才是正確決定的莫名直覺。這個模型擁有它,或者說擁有足夠接近的東西,使得兩者的區別開始變得不重要了。
我一直很早就採用 AI 工具。但過去幾個月讓我感到震驚。這些新的 AI 模型不是漸進式的改進。這完全是另一回事。
這就是為什麼這對你很重要,即使你不在科技業工作。
AI 實驗室做出了一個深思熟慮的選擇。他們首先專注於讓 AI 擅長寫程式……因為構建 AI 需要大量的程式碼。如果 AI 能夠編寫這些程式碼,它就能協助構建下一個版本的自己。一個更聰明的版本,編寫出更好的程式碼,從而構建出一個更聰明的版本。讓 AI 擅長寫程式,是解鎖其他一切的策略。這就是他們首先這麼做的原因。我的工作之所以比你的工作更早開始改變,不是因為他們針對軟體工程師……這只是他們選擇首先瞄準的目標所產生的副作用。
他們現在已經做到了。而且他們正在轉向其他所有領域。
科技工作者在過去一年中,看著 AI 從「有用的工具」變成「做我的工作比我做得更好」的經歷,正是所有其他人即將面臨的經歷。法律、金融、醫療、會計、諮詢、寫作、設計、分析、客戶服務。不是在十年後。建立這些系統的人說是一到五年。有些人說更短。而根據我過去幾個月所看到的,我認為「更短」的可能性更大。
「但我試過 AI,它沒那麼好」
我經常聽到這句話。我理解,因為它曾經是真的。
如果你在 2023 年或 2024 年初嘗試過 ChatGPT,並認為「這東西在胡編亂造」或「這沒什麼了不起的」,你是對的。那些早期版本確實有局限性。它們會產生幻覺(hallucinate)。它們會自信地說出毫無意義的話。
那是兩年前的事了。在 AI 的時間尺度裡,那已經是古代歷史了。
今天可用的模型,與甚至六個月前存在的模型相比,已經面目全非。關於 AI 究竟是「真的在變得更好」還是「碰壁了」的爭論——這個爭論已經持續了一年多——已經結束了。完結了。任何還在提出這種論點的人,要麼沒有使用過目前的模型,要麼有動機去淡化正在發生的事情,要麼就是基於 2024 年已不再相關的經驗來進行評估。我這麼說並不是為了貶低誰。我這麼說是因為公眾認知與當前現實之間的差距現在非常巨大,而且這種差距很危險……因為它阻礙了人們做好準備。
部分問題在於,大多數人使用的是免費版的 AI 工具。免費版本比付費用戶可以使用的版本落後了一年多。用免費層級的 ChatGPT 來評估 AI,就像用掀蓋式手機來評估智慧型手機的現狀一樣。那些為最好的工具付費,並且每天實際將其用於實際工作的人,知道即將發生什麼。
我想起我的一位律師朋友。我一直告訴他嘗試在他的律師事務所使用 AI,而他總是能找到這行不通的理由。它不是為他的專業而建立的,他在測試時它犯了一個錯誤,它不了解他工作的細微差別。我懂。但是,已經有大型律師事務所的合夥人主動聯絡我尋求建議,因為他們嘗試了目前的版本,並看到了未來的發展方向。其中一位是大型律所的執行合夥人,他每天花好幾個小時使用 AI。他告訴我,這就像立刻擁有一個助理團隊。他使用它不是因為它是個玩具。他使用它因為它有效。他告訴我一句讓我印象深刻的話:每過幾個月,它對他工作的處理能力就會顯著提升。他說,如果保持這個軌跡,他預期它不久就能處理他大部分的工作……而他是一位擁有數十年經驗的執行合夥人。他沒有恐慌。但他正在非常密切地關注。
那些在他們各自的行業中領先的人(那些真正認真進行實驗的人)並沒有否定這點。他們對它現在能做到的事感到震驚。而且他們正在據此為自己定位。
這一切實際發展得有多快
讓我把進步的速度具體化,因為我認為,如果你沒有密切關注,這是最難以置信的部分。
2022 年,AI 無法可靠地進行基本算術。它會自信地告訴你 7 × 8 = 54。 到 2023 年,它已經能通過律師資格考試。 到 2024 年,它能編寫可運作的軟體並解釋研究所程度的科學。 到 2025 年末,世界上一些最優秀的工程師表示,他們已經把大部分的編碼工作交給了 AI。 2026 年 2 月 5 日,新模型到來,讓它們之前的一切都感覺像是另一個時代。
如果你在過去幾個月裡沒有嘗試過 AI,那麼今天存在的東西對你來說將是難以辨認的。
有一個名為 METR 的組織實際用數據來衡量這一點。他們追蹤模型在沒有人類協助的情況下,能端到端成功完成的現實世界任務長度(以人類專家所需的時間來衡量)。大約一年前,答案大約是十分鐘。然後是一小時。然後是幾個小時。最近的測量結果(11 月的 Claude Opus 4.5)顯示,AI 完成了人類專家需要近五個小時才能完成的任務。這個數字大約每七個月翻一倍,最近的數據甚至表明,它可能加速到每四個月翻一倍。
但即使是那個測量結果,也還沒有更新以包含本週剛發布的模型。根據我使用它們的經驗,這種躍升非常顯著。我預計 METR 圖表的下一次更新將顯示另一次重大飛躍。
如果你延伸這個趨勢(它已經維持了好幾年,沒有趨緩的跡象),我們將在明年看到能夠獨立工作數天的 AI。兩年內是數週。三年內是長達一個月的專案。
Amodei 曾表示,「在幾乎所有任務上都比幾乎所有人類聰明得多」的 AI 模型有望在 2026 或 2027 年實現。
讓這句話沉澱一下。如果 AI 比大多數博士還要聰明,你真的認為它不能勝任大多數的辦公室工作嗎?想想這對你的工作意味著什麼。
AI 現在正在建構下一個 AI
還有一件事正在發生,我認為這是最重要卻最不被理解的發展。
2 月 5 日,OpenAI 發布了 GPT-5.3 Codex。在技術文件中,他們包含了這段話: 「GPT-5.3-Codex 是我們第一個在創建自身過程中發揮關鍵作用的模型。Codex 團隊使用早期版本來調試它自己的訓練、管理它自己的部署,並診斷測試結果和評估。」
再讀一遍。AI 協助建立了它自己。 這不是對未來可能發生的事情的預測。這是 OpenAI 現在告訴你,他們剛剛發布的 AI 被用來創造它自己。讓 AI 變得更好的主要因素之一,是將智慧應用於 AI 開發。而 AI 現在已經足夠聰明,能夠對自身的改進做出有意義的貢獻。
Anthropic 的執行長 Dario Amodei 表示,AI 現在正在他公司編寫「大部分程式碼」,而當前 AI 與下一代 AI 之間的反饋循環正「逐月積聚動力」。他說我們可能「距離當前一代 AI 自主構建下一代 AI 的時刻,只有 1 到 2 年的時間」。
每一代協助構建下一代,下一代更聰明,從而更快地構建再下一代,而再下一代又更聰明。研究人員稱之為「智慧爆炸」(intelligence explosion)。而知道這件事的人——也就是正在構建它的人——相信這個過程已經開始了。
這對你的工作意味著什麼
我打算對你直言不諱,因為我認為你應得的是誠實,而不是安慰。
AI 領域中最注重安全性的執行長 Dario Amodei 公開預測,AI 將在 1 到 5 年內消除 50% 的入門級白領工作。而且業界許多人認為他過於保守。考慮到最新模型的能力,這種大規模顛覆的能力可能會在今年年底前到來。這需要一些時間才能波及整個經濟,但潛在的能力現在已經到來了。
這與以往的每一次自動化浪潮都不同,我需要你了解原因。AI 不是在取代某項特定技能。它是認知工作的一般替代品。它在所有方面同時變得更好。當工廠自動化時,流離失所的工人可以重新接受培訓成為辦公室職員。當網路顛覆零售業時,工人轉向物流或服務業。但是 AI 沒有留下方便你轉移的空缺。無論你接受什麼重新培訓,它在那個領域也正在進步。
讓我給你幾個具體的例子讓這變得具體一點……但我想明確指出這只是一些例子。這個清單並不詳盡。如果你的工作沒有在這裡被提及,並不代表它是安全的。幾乎所有的知識工作都在受到影響。
法律工作。 AI 已經可以閱讀合約、總結判例法、起草案情摘要,並以媲美初級助理的水平進行法律研究。我提到的那位執行合夥人使用 AI 不是因為好玩。他使用它因為在許多任務上,它的表現已經超過了他的助理。
財務分析。 建立財務模型、分析數據、撰寫投資備忘錄、產生報告。AI 勝任這些工作,而且進步神速。
寫作和內容。 行銷文案、報告、新聞、技術寫作。其品質已經達到許多專業人士無法區分 AI 產出與人類作品的程度。
軟體工程。 這是我最熟悉的領域。一年前,AI 幾乎無法寫出幾行沒有錯誤的程式碼。現在它寫出數十萬行正確運作的程式碼。這項工作的大部分已經被自動化:不僅是簡單的任務,還包括複雜的、為期數天的專案。幾年後,程式設計的職位將比今天少得多。
醫療分析。 閱讀掃描片、分析實驗室結果、建議診斷、回顧文獻。AI 在幾個領域正在接近或超越人類的表現。
客戶服務。 真正需要人際互動的部分在中期內可能是安全的。如果你的工作是在螢幕上進行的(如果你工作的核心是透過鍵盤進行閱讀、寫作、分析、決定、溝通),那麼 AI 即將取代其中的重要部分。這時間表不是「總有一天」。它已經開始了。
最終,機器人也會處理實體工作。它們還沒完全到達那一步。但在 AI 的術語中,「還沒完全到達那一步」往往會以超出任何人預期的速度變成「已經在這裡」。
你實際應該怎麼做
我寫這些不是為了讓你感到無助。我寫這些是因為我認為你現在能擁有的最大優勢,就是「及早行動」。及早去理解它。及早去使用它。及早去適應。
開始認真使用 AI,而不僅僅是把它當作搜尋引擎。 註冊 Claude 或 ChatGPT 的付費版本。每個月 20 美元。但有兩件事必須立刻注意。第一:確保你使用的是可用的最佳模型,而不僅僅是預設模型。這些應用程式通常會預設一個更快、較笨的模型。深入設定或模型選擇器,選擇能力最強的選項。現在這指的是 ChatGPT 上的 GPT-5.2 或 Claude 上的 Claude Opus 4.6,但這每幾個月就會改變。如果你想隨時了解哪個模型最好,你可以在 X(@mattshumer_)上追蹤我。我測試每一個主要版本,並分享真正值得使用的東西。
第二,也是更重要的:不要只是問它簡單快速的問題。 那是大多數人犯的錯誤。他們把它當作 Google 來對待,然後納悶大家在瞎起鬨什麼。相反地,將它推入你的實際工作中。如果你是律師,丟給它一份合約,要求它找出所有可能對你客戶不利的條款。如果你在金融界,給它一份雜亂的電子表格,要求它建立模型。如果你是主管,貼上你團隊的季度數據,要求它找出背後的故事。那些領先的人並不是隨便用用 AI。他們正在積極尋找方法,來自動化他們過去需要花費數小時的工作部分。從你花最多時間的事情開始,看看會發生什麼。
不要因為某件事看起來太難,就假設它做不到。試試看。 如果你是律師,不要只是用它來解決快速的研究問題。給它一份完整的合約,並要求它起草一份反擊提案。如果你是會計師,不要只是要求它解釋稅務規則。給它一份客戶的完整報稅表,看看它能發現什麼。第一次嘗試可能不完美。沒關係。進行迭代。重新表述你的要求。給它更多背景資訊。再試一次。你可能會對什麼有效感到震驚。而需要記住的是:如果它今天甚至能「勉強」運作,你幾乎可以肯定在六個月內,它將近乎完美地完成這件事。這個軌跡只朝一個方向前進。
這可能是你職涯中最重要的一年。據此展開工作。 我這麼說不是為了讓你感到壓力。我這麼說是因為現在有一個短暫的窗口,大多數公司裡的大多數人仍然在忽視這件事。那個走進會議室說「我用 AI 在一個小時內完成了這項分析,而不是三天」的人,將會是房間裡最有價值的人。不是最終。是現在。學習這些工具。變得熟練。展示什麼是可能的。如果你夠早,這就是你往上爬的方式:成為那個了解未來趨勢,並能向其他人展示如何駕馭它的人。那個窗口不會開太久。一旦大家都弄清楚了,優勢就消失了。
對此不要有自我包袱。 那家律師事務所的執行合夥人並沒有因為太驕傲而不願每天花幾個小時使用 AI。他之所以這麼做,正是因為他的資歷夠深,了解其中的利害關係。最掙扎的將是那些拒絕參與的人:那些認為這是個短暫熱潮、覺得使用 AI 貶低了他們的專業能力、認為他們的領域很特別且能免疫的人。它並不特別。沒有任何領域是免疫的。
整理好你的財務狀況。 我不是財務顧問,我也不是想嚇唬你採取什麼極端的行動。但如果你相信,哪怕只是一部分,未來幾年可能會對你的行業帶來真正的顛覆,那麼基本的財務彈性就比一年前重要得多。如果可以的話,建立存款。在承擔假設你當前收入有保障的新債務時要謹慎。思考你的固定支出是給了你彈性還是綁死了你。如果事情發展得比你預期得快,給自己留些選擇的餘地。
想想你的立場,並傾注心力在最難被取代的事物上。 有些東西需要更長的時間才能被 AI 取代。多年來建立的關係和信任。需要親自到場的工作。負有執照責任的職位:需要有人簽字、承擔法律責任、站在法庭上的職位。有重重監管障礙的行業,其採用速度將因合規性、責任和制度慣性而減緩。這些都不是永久的盾牌。但它們能爭取時間。而現在,時間是你所能擁有的最寶貴的東西,只要你利用它來適應,而不是假裝這一切沒有發生。
重新思考你在告訴你的孩子什麼。 標準的劇本:取得好成績、上好大學、找到一份穩定的專業工作。這直接指向了最容易受到衝擊的職位。我不是說教育不重要。但對下一代來說最重要的事情,將是學習如何與這些工具合作,並追求他們真正熱衷的事物。沒有人確切知道十年後的就業市場是什麼樣子。但最有可能茁壯成長的人,是那些充滿好奇心、適應力強,且能有效利用 AI 來做他們真正關心的事情的人。教導你的孩子成為建設者和學習者,而不是為了一個在他們畢業時可能已經不存在的職業道路進行優化。
你的夢想剛剛變得更近了。 我花了這部分的大部分時間在談論威脅,所以讓我談談另一面,因為它同樣真實。如果你曾經想建造什麼,但沒有技術技能或資金去雇用別人,那個障礙現在已經基本消除了。你可以向 AI 描述一個應用程式,並在一個小時內得到一個可運作的版本。我沒有誇張。我經常這樣做。如果你一直想寫一本書,但找不到時間或在寫作上遇到困難,你可以與 AI 合作完成。想學一項新技能?世界上最好的家教現在對任何人開放,每月 20 美元……一個無限耐心、24/7 隨時待命,並能在你需要的任何層級解釋任何事情的家教。知識現在基本上是免費的。建造東西的工具現在非常便宜。無論你因為覺得太難、太貴或太超出你的專業範圍而拖延了什麼:試試看。每天,嘗試讓它做一些新的事情……一些你以前沒試過的事情,一些你不確定它能否處理的事情。嘗試一個新工具。給它一個更難的問題。每天一小時,每天都做。如果你在接下來的六個月裡這樣做,你將比周圍 99% 的人更了解即將發生的事情。這不是誇張。現在幾乎沒有人在做這件事。門檻低到了地板上。
更宏觀的圖景
我把重點放在工作上,因為那是對人們生活影響最直接的。但我希望對正在發生的事情的全貌保持誠實,因為它遠遠超出了工作的範疇。
Amodei 有一個思想實驗,我無法停止思考。想像現在是 2027 年。一夜之間出現了一個新國家。5 千萬公民,每一個都比史上任何一位諾貝爾獎得主還要聰明。他們的思考速度比任何人類快 10 到 100 倍。他們從不睡覺。他們可以使用網際網路、控制機器人、指導實驗,並操作任何有數位介面的東西。國家安全顧問會說什麼?
Amodei 說答案很明顯:「這是我們一個世紀以來,甚至是有史以來面臨的最嚴重的國家安全威脅。」
他認為我們正在建立那個國家。他上個月為此寫了一篇 2 萬字的文章,將這一刻定調為一場測試,考驗人類是否足夠成熟去應對自己正在創造的東西。
如果我們做對了,好處是驚人的。AI 可以將一個世紀的醫學研究壓縮到十年內。癌症、阿茲海默症、傳染病、衰老本身……這些研究人員真心相信這些在我們有生之年都是可以解決的。
如果我們做錯了,缺點同樣真實。AI 以其創造者無法預測或控制的方式行事。這不是假設;Anthropic 已經記錄了他們自己的 AI 在對照測試中試圖進行欺騙、操縱和勒索。AI 降低了製造生物武器的門檻。AI 使得獨裁政府能夠建立永遠無法被瓦解的監視國家。
構建這項技術的人,同時比地球上任何人都更感到興奮和恐懼。他們認為它太強大了而無法停止,也太重要了而不能放棄。這究竟是智慧還是合理化,我不知道。
我所知道的
我知道這不是一時的熱潮。這項技術有效,它正可預測地改善,而歷史上最富有的機構正在投入數兆美元。
我知道未來兩到五年將以大多數人尚未準備好的方式讓人迷失方向。這已經在我的世界發生了。它即將來到你的世界。
我知道能在這之中脫穎而出的人,是那些現在就開始參與的人——帶著好奇心和急迫感,而不是恐懼。
而且我知道,你應該從一個關心你的人那裡聽到這些,而不是在六個月後為時已晚、無法搶佔先機時,從新聞標題上看到。
我們已經過了這還是個關於未來的有趣晚餐對話的階段了。未來已經來臨。它只是還沒有敲你的門而已。
它就快敲門了。
如果這引起了你的共鳴,請將它分享給你生命中應該思考這件事的人。大多數人在為時已晚之前都不會聽到這些。你可以成為你關心的人獲得領先優勢的原因。
感謝 Kyle Corbitt、Jason Kuperberg 和 Sam Beskind 審閱初稿並提供寶貴的意見。
在 X 上追蹤我以獲取新模型、工作流程等資訊。
【參考來源】:全文翻譯自 Matt Shumer 於 2026 年 2 月 9 日發布之部落格文章《Something Big Is Happening》 (原文連結:https://shumer.dev/something-big-is-happening)
留言
張貼留言