Una inteligencia artificial para analizar expedientes legales automáticamente

Hombre sentado frente a una computadora con panel digital

En ámbitos donde se maneja gran cantidad de información en texto, como el legal, las técnicas de inteligencia artificial, y especialmente de Procesamiento del Lenguaje Natural (PLN), han demostrado ser útiles y eficaces para organizarla y consultarla más rápidamente.

Para aplicar los últimos avances al sector legal

Surge la colaboración del Instituto de Ingeniería del Conocimiento (IIC) y Garrigues, que han puesto a prueba un nuevo sistema: Mapa del Expediente, orientado a la organización y el tratamiento de expedientes judiciales de gran volumen.

Banner_frasco-suscripcion-800x250

Además, este sistema de Inteligencia Artificial integra el primer modelo de lenguaje adaptado al dominio legal, también desarrollado desde el IIC, sobre la base de una nueva metodología para reajustar modelos existentes y que funcionen mejor con dominios del lenguaje y terminologías específicos.

Organización y análisis de expedientes judiciales

Mapa del Expediente es un sistema capaz de procesar todo tipo de documentación asociada a un expediente judicial, normalmente de gran volumen, para organizarla, catalogarla y analizarla de forma automática.

Una vez recibida la información en forma de ficheros PDF, mediante técnicas de OCR (Optical Character Recognition), se transcriben y digitalizan todas las páginas del expediente y se divide el volumen en partes o documentos individuales. Estos se catalogarán automáticamente dependiendo del escrito del que se trate: partes, actas de declaración, cédulas de citación, diligencias, providencias o autos, entre otros.

De esta forma, el sistema permite a los usuarios consultar rápidamente la información relevante, pero también identificar a personas o empresas que aparecen mencionadas en los diferentes documentos y establecer una red de relaciones entre estas entidades. Una información que puede, además, visualizarse en forma de grafo, conformando un auténtico mapa para navegar por el expediente.

Primer modelo de lenguaje del español legal

Mapa del Expediente cuenta a su vez con el primer modelo de lenguaje en español adaptado al sector legal. Este ha sido creado por el IIC según una metodología propia que permite adaptar modelos ya existentes a diferentes dominios del lenguaje, como el que se habla y se escribe en el sector legal.

Un modelo de lenguaje es una red neuronal artificial capaz de analizar ingentes volúmenes de texto escrito para aprender la estructura de un determinado idioma. Son ya conocidos modelos generales como BERT o GPT-3, que sirven de base y se ajustan para resolver distintas tareas de PLN: clasificación de documentos, resumen o traducción automática, generación de textos, entre otras.

No obstante, estos modelos pueden no funcionar tan eficazmente cuando se encuentran con los términos y la jerga empleados en sectores especializados, como el médico, el financiero o el legal. De ahí el interés por crear un modelo de lenguaje específico para cada ámbito con la metodología mencionada.

Conoce más aquí

 


Reciba las últimas noticias de la industria en su casilla:

Suscribirse ✉