【杜蘭說AI】GPT-4.5三大關鍵詞貴！小強！情商！

GPT-4.5剛發布的時候，
我就覺得得讓子彈再飛一會兒，
結果就過了一個周末，
各種聲音全都出來了。

我個人差不多就三個感覺哈。
第一，
知道你openai貴，
但也不能這麽離譜啊？
輸入價格75刀，
輸出價格150刀，
比DeepSeek貴了快300倍。
如此恐怖的成本提升下，
GPT-4.5的性能怎麽樣呢？

這就是我的第二個感受，
確實變強了，但只有一點點。
官方給出的基準測試里，
GPT-4.5是碾壓GPT-4o的，
在最新的一項編碼測試里，
也超越了DeepSeek-R1、o1、GPT-4o等模型，
但在一些比較困難的學術基準測試上，
就不太夠看了，
在某些偏實用的評估基準上，
甚至是全班墊底。

不過OpenAI官方這次也特意強調，
說GPT-4.5的真正厲害之處，
在於它能夠更好地理解人類的意思，
並以更細致入微的“情商”來解讀微妙的暗示或隱含的期望。
用奧特曼的話來說，
就是你會感覺在和一個“有思想的人”說話。
因為GPT-4.5現在只向Pro用戶開放，
我沒買它的會員，
所以只看了一些用戶PO到網上的圖。
對此我的第三個感覺是，
看起來確實有人情味兒了些，
會先安慰你，
給你情緒價值，
而不是直接給一堆解決方案。
但這就能證明它比別家更強嗎？
很難說。
更何況它收費還那麽貴，
頗有一種要算法有情商、
要推理有情商、
要應用還是只有情商的感覺。

最後再給大家展開一下啊，
這次的GPT-4.5還有一個意義，
它很有可能是OpenAI的最後一代非推理模型。
什麽意思呢？
現在業界大模型架構是“重推理”的，
也就是基於傳統的語言模型，
通過思維鏈、自我驗證等多步中間推理生成答案，
擅長編程、學術寫作以及分析覆雜問題，
典型代表就是DeepSeek-R1和GPT-o1。
與之相對的就是非推理大模型，
主要依賴預訓練階段的高質量參數進行學習，
邏輯推理能力稍弱，
更側重於流暢的語言生成和上下文理解，
代表是GPT-o3-mini。

這幾天推理模型陣營的DeepSeek
剛剛把自己壓箱底的寶貝都拿了出來，
搞得全球的開發者都一片沸騰，
這邊非推理模型GPT-4.5的風評，
大家又都有目共睹，
所以我估計，
以後大部分AI的方向，
可能都將會徹底轉向推理。

FINMETA

【線上社區】

【線下空間】

【杜蘭說AI】GPT-4.5三大關鍵詞 貴！小強！情商！

FINMETA

【線上社區】

【線下空間】

【杜蘭說AI】GPT-4.5三大關鍵詞貴！小強！情商！