Salta al contenuto
← projects
ai Python · Heretic · Hugging Face · Jupyter

Heretic Models

Raccolta di modelli linguistici modificati con la tecnica di abliteration, accompagnati da configurazioni, notebook e pesi pubblicati su Hugging Face.

Problema
Studiare come cambiano i comportamenti di rifiuto di un LLM richiede esperimenti riproducibili e un confronto con il modello originale.
Soluzione
La repository documenta varianti abliterated di TinyLlama e Mistral, includendo configurazioni, template di chat, notebook e misure di divergenza KL.
Risultato
Artefatti sperimentali consultabili e caricabili con la libreria Transformers per analizzare gli effetti della modifica mantenendo tracciata la distanza dall'originale.
Stack
PythonHereticHugging FaceJupyter

Esperimenti sui pesi

Il catalogo raccoglie modelli prodotti con Heretic e i file necessari a descriverne architettura e modalità di conversazione. La divergenza KL viene riportata come indicatore della deviazione dal modello di partenza.

Uso responsabile

I modelli sono presentati come materiale sperimentale: la rimozione di alcuni comportamenti di rifiuto non sostituisce valutazioni di sicurezza e adeguatezza per uno specifico utilizzo.