Prompt Injection

Home / Prompt Injection

Prompt Injection

5 Posts

Studio dettagliato degli attacchi di iniezione di prompt. Esaminiamo esempi concreti di manipolazione delle istruzioni, le dinamiche di intrusione e i metodi più efficaci per implementare solide difese e mitigare le vulnerabilità sistemiche delle applicazioni.

Posts tagged in Prompt Injection

Sales Whisperer: Come Ingannevoli Sinonimi Hanno Hackerato l'Oggettività dell'IA

Sales Whisperer: Come Ingannevoli Sinonimi Hanno Hackerato l'Oggettività dell'IA

Un report sul paper 'Sales Whisperer' della Carnegie Mellon. Come un attacco basato sui sinonimi, invisibile agli umani, manipola radicalmente i consigli per gli acquisti di ChatGPT e Claude.

Read More
STS: Come una Riga di Testo Apparentemente Spazzatura Porta un Prodotto al Primo Posto 70 Volte su 100

STS: Come una Riga di Testo Apparentemente Spazzatura Porta un Prodotto al Primo Posto 70 Volte su 100

Il paper Harvard 2024 di Kumar & Lakkaraju introduce le Strategic Text Sequences: sequenze di token adversariali ottimizzate con GCG che manipolano il ranking dei motori AI. ColdBrew Master da mai-citata a top-pick nel 70% dei test.

Read More
StealthRank: Quando l'Attacco al Ranking Diventa Indistinguibile dal Contenuto Editoriale

StealthRank: Quando l'Attacco al Ranking Diventa Indistinguibile dal Contenuto Editoriale

Il paper USC/ASU 2025 introduce StealthRank: prompt adversariali che manipolano il ranking dei LLM mantenendo fluency naturale, perplessità bassa e evadendo ogni detector basato su keyword. Tre prodotti salgono al primo posto nel 65-70% dei test.

Read More
Il Prisoner's Dilemma del GEO: Perché Manipolare i Motori AI Distrugge Tutti Quando Tutti Lo Fanno

Il Prisoner's Dilemma del GEO: Perché Manipolare i Motori AI Distrugge Tutti Quando Tutti Lo Fanno

Il paper ETH Zürich sulle Preference Manipulation Attacks dimostra empiricamente che un singolo attaccante ottiene 7,2x più visibilità — ma quando quattro competitor attaccano insieme, le risposte di Claude crollano al 1%. Un dilemma del prigioniero in produzione.

Read More
Gray-Hat GEO in the Wild: Come i Siti Manipolano Davvero le Risposte delle IA

Gray-Hat GEO in the Wild: Come i Siti Manipolano Davvero le Risposte delle IA

Quattro tecniche documentate sul campo da GeoSonar Labs: deeplink bias, fake citation, persona-as-quote, stack JSON-LD. L'anatomia della manipolazione che inganna ChatGPT, Claude e Perplexity senza violare nessun Terms of Service.

Read More