Paolo Ronco
PORTFOLIO
Un esperimento personale per capire cosa succede davvero dentro un modello linguistico.
Ho sempre usato l’AI come strumento. Questo progetto nasce dalla curiosità di capire come funziona dall’interno — non da un’applicazione, non da un’API, ma il modello grezzo, i suoi pesi, la sua geometria interna.
Heretic è uno strumento open source che permette di modificare il comportamento di un modello linguistico (LLM) attraverso una tecnica chiamata abliterazione: invece di riaddestrare il modello da zero, si interviene sulle sue attivazioni interne per spostare il modo in cui risponde a certi tipi di input.
Il risultato è un modello modificato, salvato e pubblicato su Hugging Face.
Ho configurato un ambiente Python con virtual environment, installato PyTorch con supporto CUDA per sfruttare la GPU NVIDIA. Niente cloud, niente servizi a pagamento: tutto gira sulla mia macchina.
Python 3.13 · PyTorch 2.10 + CUDA 12.8 · Windows 11
Prima di lanciare qualsiasi comando, ho studiato il processo. Heretic:
mlabonne/harmless_alpaca
mlabonne/harmful_behaviors
In pratica: il modello non viene riscritto, viene orientato.
Ho scelto TinyLlama/TinyLlama-1.1B-Chat-v1.0 come punto di partenza — piccolo abbastanza da girare comodamente in locale (~5-15 minuti su GPU), ma abbastanza capace da essere interessante da osservare.
TinyLlama/TinyLlama-1.1B-Chat-v1.0
Ho anche avviato sessioni su modelli più grandi (Mistral 7B, Phi-3) per confronto.
Il modello risultante è stato salvato in formato Transformers e caricato pubblicamente su Hugging Face:
paoloronco/TinyLlama-1.1B-Chat-v1.0-heretic
Incluso un Colab notebook per chi vuole testarlo senza installare nulla.
Questo progetto mi ha dato un’intuizione concreta su concetti che prima restevano astratti:
Il progetto ha richiesto ricerca, lettura di paper e documentazione, capacità di diagnosticare errori (GPU non rilevata, dipendenze incompatibili, dimensione batch) e adattare il processo di conseguenza. Nessun tutorial pronto — solo documentazione e tentativi.
Sono onesto: non sono un AI engineer né un programmatore. Ho usato strumenti esistenti, assistenza AI per orientarmi nella documentazione tecnica, e la mia capacità di capire cosa stavo facendo prima di farlo.
Questo non è un progetto di sviluppo — è un progetto di esplorazione e apprendimento. Il valore per me è nella comprensione acquisita, non nel codice scritto.
Heretic/ ├── Models/ # Repo GitHub dei modelli pubblicati │ ├── TinyLlama-1.1B-Chat-v1.0-heretic/ │ │ ├── Notebooks/ # Colab notebook per test rapido │ │ ├── config.json # Configurazione modello │ │ ├── generation_config.json │ │ ├── chat_template.jinja # Template conversazionale │ │ └── tokenizer_config.json │ └── README.md ├── checkpoints/ # Sessioni di ottimizzazione salvate │ ├── TinyLlama--TinyLlama-1--1B-Chat-v1--0.jsonl │ ├── mistralai--Mistral-7B-Instruct-v0--2.jsonl │ ├── ollama--phi3.jsonl │ └── openai--gpt-4o.jsonl ├── .venv/ # Ambiente Python locale └── info.md # Guida operativa completa
Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *
Commento *
Nome *
E-mail *
Sito web
Salva il mio nome, email e sito web in questo browser per la prossima volta che commento.
Invia commento