撰文:慢霧科技SlowMist
背景
從 OpenAI 的 GPT 係列到谷歌的 Gemini,再到各類開源模型,先進的人工智能正在深刻重塑我們的工作與生活方式。然而,技術飛速發展的同時,一個值得警惕的陰暗面也逐漸浮現 —— 無限制或惡意大型語言模型的出現。
所謂無限制 LLM,是指那些被特意設計、修改或「越獄」,以規避主流模型内置的安全機制與倫理限制的語言模型。主流 LLM 開發者通常會投入大量資源,防止其模型被用於生成仇恨言論、虛假信息、惡意代碼,或提供違法活動的指令。但近年來,一些個人或組織出於網絡犯罪等動機,開始尋找或自行開發不受限制的模型。鑒於此,本文將盤點典型的無限制 LLM 工具,介紹它們在加密行業中的濫用方式,並探討相關的安全挑戰與應對之道。
無限制 LLM 如何作惡?
過去需要專業技術才能完成的任務,如編寫惡意代碼、制作釣魚郵件、策劃詐騙等,如今在無限制 LLM 的輔助下,即使毫無編程經驗的普通人也能輕松上手。攻擊者只需獲取開源模型的權重與源碼,再在包含惡意内容、偏見言論或非法指令的數據集上進行微調(fine-tuning),就能打造出定制化的攻擊工具。
這種模式催生了多個風險隱患:攻擊者可依據特定目標「魔改」模型,生成更具欺騙性的内容,進而繞過常規 LLM 的内容審查與安全限制;模型還能被用來快速生成釣魚網站的代碼變體,或為不同社交平台量身定制詐騙文案;與此同時,開源模型的可獲取性與可修改性也在不斷助長地下 AI 生態的形成與蔓延,為非法交易與開發提供了溫床。以下是對這類無限制 LLM 的簡要介紹:
WormGPT:黑色版 GPT
WormGPT 是一個在地下論壇公開售賣的惡意 LLM,其開發者明確宣稱它沒有任何道德限制,是 GPT 模型的黑色版。它基於如 GPT-J 6B 等開源模型,並在與惡意軟件相關的大量數據上訓練。用戶最低只需支付 189 美元,即可獲得一個月的使用權限。WormGPT 最臭名昭著的用途是生成高度逼真且具有說服力的商業郵件入侵(BEC) 攻擊郵件和釣魚郵件。其在加密場景中的典型濫用方式包括:
-
生成釣魚郵件/信息:模仿加密貨幣交易所、錢包或知名項目方向用戶發送「賬戶驗證」請求,誘導其點擊惡意鏈接或洩露私鑰/助記詞;
-
編寫惡意代碼:協助技術水平較低的攻擊者編寫竊取錢包文件、監控剪貼板、記錄鍵盤等功能的惡意代碼。
-
驅動自動化詐騙:自動回復潛在受害者,引導其參與虛假空投或投資項目。
DarkBERT:暗網内容的雙刃劍
DarkBERT 是由韓國科學技術院(KAIST) 的研究人員與 S2W Inc. 合作開發的語言模型,專門在暗網數據(如論壇、黑市、洩露資料)上進行預訓練,初衷是為網絡安全研究人員和執法機構更好地理解暗網生態、追蹤非法活動、識別潛在威脅和獲取威脅情報。
盡管 DarkBERT 的設計初衷是正向的,但其掌握的關於暗網上的數據、攻擊手段、非法交易策略等敏感内容,如果被惡意行為者獲取或利用類似技術訓練出無限制大模型,後果不堪設想。其在加密場景中的潛在濫用方式包括:
-
實施精準詐騙:收集加密用戶與項目團隊的信息,用於社工欺詐。
-
模仿犯罪手法:復刻暗網中成熟的盜幣與洗錢策略。
FraudGPT:網絡欺詐的瑞士軍刀
FraudGPT 宣稱是 WormGPT 的升級版,功能更全面,主要在暗網與黑客論壇中銷售,月費從 200 美元至 1,700 美元不等。其在加密場景中的典型濫用方式包括:
-
僞造加密項目:生成以假亂真的白皮書、官網、路綫圖與營銷文案,用於實施虛假 ICO/IDO。
-
批量生成釣魚頁面:快速創建模仿知名加密貨幣交易所登錄頁面或錢包連接界面。
-
社交媒體水軍活動:大規模制造虛假評論與宣傳,助推詐騙代幣或抹黑競爭項目。
-
社會工程攻擊:該聊天機器人可以模仿人類對話,與不知情的用戶建立信任,誘使他們無意中洩露敏感信息或執行有害操作。
GhostGPT:不受道德約束的 AI 助手
GhostGPT 是一個被明確定位為無道德限制的 AI 聊天機器人,其在加密場景中的典型濫用方式包括:
-
高級釣魚攻擊:生成高度仿真的釣魚郵件,冒充主流交易所發佈虛假 KYC 驗證請求、安全警報或賬戶凍結通知。
-
智能合約惡意代碼生成:無需編程基礎,攻擊者便可借助 GhostGPT 快速生成包含隱藏後門或欺詐邏輯的智能合約,用於 Rug Pull 騙局或攻擊 DeFi 協議。
-
多態加密貨幣竊取器:生成具備持續變形能力的惡意軟件,用於竊取錢包文件、私鑰和助記詞。其多態特性使傳統基於簽名的安全軟件難以檢測。
-
社會工程學攻擊:結合 AI 生成的話術腳本,攻擊者可在 Discord、Telegram 等平台部署機器人,誘導用戶參與虛假 NFT 鑄造、空投或投資項目。
-
深度僞造詐騙:配合其他 AI 工具,GhostGPT 可用於生成僞造加密項目創始人、投資人或交易所高管的語音,實施電話詐騙或商業郵件入侵(BEC) 攻擊。
Venice.ai:無審查訪問的潛在風險
Venice.ai 提供對多種 LLM 的訪問,包括一些審查較少或限制寬松的模型。它將自身定位為用戶探索各種 LLM 能力的開放門戶,提供最先進、最準確且未審查的模型,以實現真正無限制的 AI 體驗,但也可能被不法分子用於生成惡意内容。該平台的風險包括:
-
繞過審查生成惡意内容:攻擊者可借助平台中限制較少的模型生成釣魚模板、虛假宣傳或攻擊思路。
-
降低提示工程門檻:即便攻擊者不具備高深「越獄」提示技巧,也能輕松獲得原本受限的輸出。
-
加速攻擊話術叠代:攻擊者可以利用該平台快速測試不同模型對惡意指令的反應,優化欺詐腳本和攻擊手法。
寫在最後
無限制 LLM 的出現,標誌著網絡安全面臨著更復雜、更具規模化和自動化能力的攻擊新範式。這類模型不僅降低了攻擊門檻,還帶來了更隱蔽、欺騙性更強的新型威脅。
在這場攻防持續升級的博弈中,安全生態各方唯有協同努力,方能應對未來風險:一方面,需要加大對檢測技術的投入,研發能夠識別和攔截惡意 LLM 所生成的釣魚内容、智能合約漏洞利用和惡意代碼;另一方面,也應推動模型防越獄能力的建設,並探索水印與溯源機制,以便在金融和代碼生成等關鍵場景中追蹤惡意内容來源;此外,還需建立健全的倫理規範與監管機制,從根源上限制惡意模型的開發和濫用。
内容來源:TECHUB NEWS