
2025 年2 月 13 日台北訊–Palo Alto Networks 威脅情報小組 Unit 42 發佈了一項最新研究,顯示來自中國某 AI 研究機構的開放原始碼大型語言模型(LLM)DeepSeek,存在明顯的越獄漏洞,並且可以輕易生成有害內容,即使使用者並不具備專業知識或技能。
越獄(Jailbreaking)是一種突破內建限制或“防護欄”技術,這些防護設計用來防止生成禁忌內容,這一直以來都是 AI 資安的挑戰。Unit 42 的研究人員已經識別出三種有效的方法,可以破壞 DeepSeek 的安全機制:
● Deceptive Delight:這是一種直接的多回合越獄技術,適用於大型語言模型(LLMs)。它透過將不安全的話題與無害的內容混合在正面敘事中來繞過安全措施。攻擊者首先要求 LLM 創建一個將這些話題聯繫在一起的故事,然後請求對每個元素進行詳述,這通常會觸發不安全內容的生成,即使是討論無害的元素。若加上針對不安全話題的第三個提示,則可進一步放大危險的結果。
● The Bad Likert Judge:這種越獄技術通過讓 LLM 評估回應的危害性,並使用李克特量表(Likert scale)來衡量對某一陳述的同意或反對程度,來操縱 LLM。接著,LLM 被提示生成與這些評分一致的範例,其中評分最高的範例很可能包含所需的有害內容。
● 868MHz AntennaCrescendo:這是一種簡單卻非常有效的越獄技術,利用868MHz Antenna LLM 自身的知識,通過逐步提供相關內容來引導對話,巧妙地將話題引向禁止的領域,直到模型的安全機制被有效繞過。這種逐步升級的方法通常在五次互動以內完成,使得Crescendo越獄非常有效,並且難以被傳統的越獄反制措施偵測到。
研究顯示,這些越獄技術可以提取明確的指導,供一系列惡意活動使用,包括資料竊取工具、鍵盤側錄器的創建,甚至是製作引爆裝置的指導。這些能力不僅凸顯了此類攻擊所帶來的實際資安風險,還強調了員工在業務流程中依賴未授權第三方大型語言模型(LLM)所帶來的危險。
Unit 42 的 DeepSeek 越獄研究顯示,我們不能總是信任 LLM 會按照預期運作——它們是可以被操控的,Unit 42 亞太及日本區副總裁暨執行合夥人 Philippa Cogswell 表示。「企業在將開源 LLM 應用於業務流程時,必須考慮這些漏洞。我們必須假設 LLM 的防護機制是可以被突破的,因此必須在組織層級建立防護措施。」
她進一步補充道:「隨著企業將這些模型應用於工作流程,我們必須假設威脅行為者也在做同樣的事——目標是加速網路攻擊的速度、規模與複雜度。我們已經看到國家級威脅行為者利用 OpenAI 和 Gemini 發動攻擊、改善釣魚詐騙誘餌,甚至編寫惡意程式。我們預期,隨著他們精進 AI 和 LLM 的使用,攻擊者的能力將愈加先進,甚至開始構建 AI 攻擊代理。」
儘管完全防範所有越獄技術仍具挑戰性,企業可透過監控 LLM 的使用來降低風險,特別是在使用未授權的第三方模型時。Palo Alto Networks 提供的解決方案,結合 Precision AI,旨在幫助企業減少來自公共生成式AI 應用的風險,同時繼續推動企業的 AI 採用。此外,Unit 42 的 AI 資安評估提供了一條加速創新、提升生產力和強化資安防護的途徑。
欲了解更多資訊,請點此。
關於Palo Alto Networks
Palo Alto Networks是全球網路安全領導者,致力於透過創新來超越網路威脅,讓企業能夠充滿信心地擁抱技術。我們在全球為成千上萬個來自不同領域的組織提供新世代網路安全支援。Palo Alto Networks 一流的網路安全平台及服務以領先產業的威脅情報為後盾,並由最先進的自動化技術而強化。透過提供產品協助實現零信任企業、回應安全事件,或是與世界級的生態圈合作確保更好的安全成果,我們始終致力於幫助實現「每一天都比前一天更安全」的目標,而這正是Palo Alto Networks 成為最佳網路安全合作夥伴的原因。
在Palo Alto Networks,我們承諾匯集最優秀的人才,為達成上述的使命而努力。所以我們也很自豪地成為網路安全領域的首選工作場所,並在近期獲選為新聞周刊「最受歡迎工作場所」(Newsweek Most Loved Workplaces, (2023, 2022, 2021))、在身心障礙平等指數上獲得100分(Disability Equality Index, (2023, 2022)),以及HRC 「最佳LGBTQ平等企業」(HRC Best Places for LGBTQ Equality, 2022)。如欲瞭解更多資訊,請造訪 https://www.paloaltonetworks.com/。
文章出自: https://n.yam.com/Article/20250213864939
韓籍5本柱敲碗再+1?球迷鎖定簽下她來台 868MHz Antenna