Come sfruttare a pieno il proprio potenziale
L'arte e la scienza del prompt engineering, e perché il prompt engineering da solo serve a poco.
Il prompt engineering è diventato una disciplina. Esistono corsi, certificazioni, annunci di lavoro, consulenti. E le tecniche sono reali: prompt strutturati, esempi few-shot, ragionamento a catena, il lessico tecnico corretto al posto di descrizioni vaghe. Migliorano in modo misurabile la pertinenza e la qualità di ciò che si ottiene. Niente di tutto questo è sbagliato.
Ma c'è un tetto, e arriva prima di quanto il clamore ammetta. Padroneggiare i prompt porta in modo affidabile a un risultato buono. Non porta a un risultato migliore. Qui parlo del perché quel tetto esista, e di dove si trovi davvero la leva — perché non è nel prompt.
Cosa ti dà davvero un prompt
Usato bene, un prompt fa una cosa sola: ti aiuta a chiedere, con precisione, qualcosa che il modello tende già a produrre. Struttura booleana, esempi concreti, una catena che costringe i passaggi a mostrarsi — restringono il modello verso la risposta che avevi in mente. È utile davvero, e la maggior parte delle persone scrive prompt abbastanza male da rendere l'apprendimento della tecnica un investimento da un pomeriggio.
Nota però la forma di ciò che sta facendo. Ti sta rendendo più efficiente nell'estrarre il probabile. Migliore è il prompt, più in fretta e più pulito arrivi alla risposta più verosimile. Ed è esattamente questo il problema, quando si guarda a cosa accade su un'intera popolazione di utenti invece che su una singola richiesta.
Il pavimento si alza
L'IA solleva chi è meno capace verso la competenza, e l'evidenza non è sottile.
Nel primo grande studio sul campo dell'IA generativa sul lavoro, oltre 5.000 operatori del customer support che usavano un assistente IA hanno risolto in media il 14% di richieste in più all'ora — ma il guadagno era intorno al 34% per gli operatori meno esperti e vicino allo zero per i migliori (Brynjolfsson, Li & Raymond). Lo strumento funzionava catturando gli schemi dei più bravi e consegnandoli a tutti gli altri. In uno studio controllato sulla scrittura, gli autori meno creativi hanno migliorato la qualità dei loro racconti fino al 26,6% con GPT-4, mentre i più forti si sono mossi a malapena (Doshi & Hauser).
È un fatto reale, e lo scetticismo di maniera lo ignora. Se un compito è circoscritto e ha una risposta giusta conoscibile, l'IA tira un principiante verso il livello dei tuoi migliori. Un buon prompt accelera la salita. Ma il pavimento è dove ci si ferma.
Il tetto è più basso di quanto sembri
La stessa spinta che alza il pavimento appiattisce la cima. Non peggiorando il singolo output, ma ancorando la direzione di tutti allo stesso punto: il centro statisticamente probabile di tutto ciò che il modello ha visto. Fai la stessa domanda a chi è bravo e a chi non lo è, scrivi un buon prompt per entrambi, e le risposte tendono ad avvicinarsi.
Così gli output convergono. Il pavimento si alza, il tetto si assesta, e quasi tutti finiscono nello stesso punto: competenti, fluidi, difendibili e indistinguibili da ciò che ha ottenuto la persona accanto con lo stesso strumento. Un prompt migliore è una via più rapida verso quel centro, non un'uscita. È la parte che il discorso sul prompt engineering omette: la tecnica ottimizza per il probabile, e il probabile è, per definizione, ciò che stanno ottenendo anche tutti gli altri.
Sapere di più aiuta — ma non come immagini
C'è una vecchia intuizione per cui un fisico ottiene risposte migliori sulla fisica e un avvocato risposte migliori sul diritto. È vera. Ma il motivo non è che l'esperto scrive prompt più astuti.
È che l'esperto legge la risposta in modo diverso. Vede dove è sottilmente sbagliata. Non accetta la prima versione fluida. Sa che aspetto avrebbe la risposta non ovvia, quindi continua a spingere quando il modello gli offre quella ovvia. Guarda cosa succede quando questa capacità manca: in uno studio su 758 consulenti, l'IA era una vittoria netta sui compiti dentro la sua competenza — più cose fatte, più in fretta, di qualità superiore — ma su un compito messo deliberatamente appena fuori da quella frontiera, i consulenti che usavano l'IA avevano 19 punti percentuali di probabilità in meno di rispondere correttamente rispetto a chi lavorava senza (Dell'Acqua et al.). Il modello produceva una risposta sicura, ben strutturata e sbagliata, e chi la teneva in mano non se ne accorgeva.
L'abilità che contava lì non era il prompting. Era il rifiuto di fidarsi di una risposta plausibile.
Dove si trova allora la leva
Non nel prompt, e nemmeno, da sola, in quanto sai. Si trova in come ti rapporti a ciò che torna indietro: se lo interroghi, se te ne discosti, se lo tratti come una bozza da contestare invece che come un risultato da consegnare. La conoscenza conta perché abilita quella contestazione — ti dà il terreno su cui stare mentre spingi indietro. Ma l'esperto che si disinteressa e accetta l'output finisce nella stessa media di tutti gli altri, solo con più autorità a sostenere l'errore.
Quella disposizione è più rara dell'abilità coi prompt e molto più difficile da insegnare in un pomeriggio. Ed è tutto il gioco.
Perché conta se gestisci una piccola impresa
La distintività è l'asset. Una grande azienda può scivolare verso la media e sopravvivere su marchio e distribuzione; una più piccola di solito compete proprio sulla cosa che la convergenza erode. Se la tua analisi, i tuoi contenuti e le tue decisioni si assestano tutti sullo stesso output probabile che i tuoi concorrenti tirano fuori dagli stessi modelli, ti sei reso efficiente e intercambiabile nella stessa mossa. La padronanza dei prompt non ti salva, perché i prompt di tutti convergono nello stesso punto.
C'è qualcosa sotto tutto questo su cui voglio tornare: perché alcune persone ottengono qualcosa di davvero eccezionale da questi strumenti mentre la maggior parte ottiene una via più rapida verso la stessa media — e se sia un tratto fisso o un'abitudine che si può costruire di proposito. È la domanda che vale la pena inseguire, e la riprenderò in un pezzo successivo.
Fonti
- Brynjolfsson, Li & Raymond, "Generative AI at Work", NBER Working Paper 31161 (2023) — guadagno medio di produttività del 14%; circa 34% per gli operatori meno esperti; effetto minimo sui più qualificati.
- Doshi & Hauser, "Generative AI Enhances Individual Creativity but Reduces the Collective Diversity of Novel Content", Science Advances (2024) — miglioramento fino al 26,6% per gli scrittori meno creativi.
- Dell'Acqua et al., "Navigating the Jagged Technological Frontier", Harvard Business School Working Paper 24-013 (2023) — dentro la frontiera: più compiti, più velocità, qualità maggiore; fuori: 19 punti percentuali di accuratezza in meno con l'IA.
Comments ()