【杜蘭說AI】GPT-4.5三大關鍵詞 貴!小強!情商!

|
我就覺得得讓子彈再飛一會兒,
結果就過了一個周末,
各種聲音全都出來了。
我個人差不多就三個感覺哈。
第一,
知道你openai貴,
但也不能這麽離譜啊?
輸入價格75刀,
輸出價格150刀,
比DeepSeek貴了快300倍。
如此恐怖的成本提升下,
GPT-4.5的性能怎麽樣呢?
這就是我的第二個感受,
確實變強了,但只有一點點。
官方給出的基準測試里,
GPT-4.5是碾壓GPT-4o的,
在最新的一項編碼測試里,
也超越了DeepSeek-R1、o1、GPT-4o等模型,
但在一些比較困難的學術基準測試上,
就不太夠看了,
在某些偏實用的評估基準上,
甚至是全班墊底。
不過OpenAI官方這次也特意強調,
說GPT-4.5的真正厲害之處,
在於它能夠更好地理解人類的意思,
並以更細致入微的“情商”來解讀微妙的暗示或隱含的期望。
用奧特曼的話來說,
就是你會感覺在和一個“有思想的人”說話。
因為GPT-4.5現在只向Pro用戶開放,
我沒買它的會員,
所以只看了一些用戶PO到網上的圖。
對此我的第三個感覺是,
看起來確實有人情味兒了些,
會先安慰你,
給你情緒價值,
而不是直接給一堆解決方案。
但這就能證明它比別家更強嗎?
很難說。
更何況它收費還那麽貴,
頗有一種要算法有情商、
要推理有情商、
要應用還是只有情商的感覺。
最後再給大家展開一下啊,
這次的GPT-4.5還有一個意義,
它很有可能是OpenAI的最後一代非推理模型。
什麽意思呢?
現在業界大模型架構是“重推理”的,
也就是基於傳統的語言模型,
通過思維鏈、自我驗證等多步中間推理生成答案,
擅長編程、學術寫作以及分析覆雜問題,
典型代表就是DeepSeek-R1和GPT-o1。
與之相對的就是非推理大模型,
主要依賴預訓練階段的高質量參數進行學習,
邏輯推理能力稍弱,
更側重於流暢的語言生成和上下文理解,
代表是GPT-o3-mini。
這幾天推理模型陣營的DeepSeek
剛剛把自己壓箱底的寶貝都拿了出來,
搞得全球的開發者都一片沸騰,
這邊非推理模型GPT-4.5的風評,
大家又都有目共睹,
所以我估計,
以後大部分AI的方向,
可能都將會徹底轉向推理。
FINMETA
香港Web3生態服務商
官方網站:www.finmeta.com.hk
公眾號、視頻號:FINMETA
X.COM:https://x.com/FINMETA_NEWS
YOUTUBE:https://www.youtube.com/@FINMETA_NEWS
Bilibili:https://space.bilibili.com/627654383/channel/collectiondetail?sid=652860
【線上社區】
TG group:https://t.me/finmeta_web3
WhatsApp group:https://chat.whatsapp.com/IgMyxP1ssiO0k212SJJ9U5
Discord group:https://discord.com/invite/vrBdf6YGP3
【線下空間】
Web3 Space:https://www.finmeta.com.hk/en-us/field
地址:香港金鐘道95號 統一中心 2001
Room 2001,Unity Center ,95 Queensway, Admiralty, Central District, Hong Kong Island
The intellectual property rights of the content published by FINMETA are exclusively owned or held by FINMETA and related rights holders. Any use such as reprinting, excerpting, copying and mirroring is prohibited without permission. If you are willing to reprint, please send an email to info [email protected] finmeta.com.hk and obtain written confirmation and authorization before reprinting.