Dal human-in-the-loop al LLM-in-the-loop per l'annotazione dei datasets giuridici

Autori

DOI:

https://doi.org/10.6092/issn.1825-1927/20421

Parole chiave:

Natural Language Processing, Data annotation, Large Language Models, Responsabilità, Prompt engineering, IA generativa

Abstract

Annotare documenti legali con strutture retoriche è difficile e richiede molto tempo, soprattutto se fatto completamente manualmente. Questo documento esplora due metodologie per risultati ottimali: in primo luogo, un approccio human-in-the-loop basato su un processo di annotazione in più fasi con esperti di dominio che esaminano e revisionano i set di dati in modo iterativo. Per migliorare la interpretabilità, vengono incorporati modelli di intelligenza artificiale spiegabile (XAI), che aiutano a comprendere i processi decisionali. In secondo luogo, un metodo LLM-in-the-loop prevede che gli esseri umani sfruttano modelli linguistici generativi di grandi dimensioni (LLM) per assistere gli esperti automatizzando attività di annotazione ripetitive sotto supervisione. Sono proposte ulteriori ricerche per sviluppare modelli di interazione che bilancino efficacemente l'automazione con la guida e la responsabilità umane.

Downloads

Pubblicato

2024-12-30

Come citare

Carnat, I. (2024) «Dal human-in-the-loop al LLM-in-the-loop per l’annotazione dei datasets giuridici», i-lex. Bologna, Italy, 17(1), pagg. 27–40. doi: 10.6092/issn.1825-1927/20421.

Fascicolo

Sezione

Articoli