¡Bienvenidos de nuevo! Espero que hayáis pasado unas buenas vacaciones, desconectando de las obligaciones profesionales y disfrutando de la compañía de vuestras familias y amigos.
El tema que os propongo viene a colación con el auge de las nuevas tecnologías en materia legal (legaltech), aunque desde el punto de vista de un documentalista jurídico.
El libro «Legal tech: la transformación digital de la abogacía» dirigido por Moisés Barrio Andrés ha estado en boca del sector desde finales de primavera y principios de verano. La obra estudia la aplicación de la transformación digital y la revolución tecnológica que está afectando a la abogacía y al resto de profesiones relacionadas.
Tras la lectura de varios capítulos, en mi opinión, hay uno en especial que merece ser leído por la comunidad universitaria y los profesionales especializados en la documentación jurídica.
Carlos Fernández Hernández y Ángel Sancho Ferrer han hecho un gran trabajo en «La búsqueda de información jurídica: de los tesauros a la inteligencia artificial«. El capítulo analiza los motores de búsqueda de software jurídicos desde su origen para que el lector entienda cómo ha ido evolucionando a lo largo de los años.
Los sistemas de búsqueda recuperan la información localizando los resultados por medio de diccionarios (recogen el listado de los descriptores de los documentos) y listas de coincidencias (documentos indexados contenidos en la base de datos). Por lo tanto, si se formula una pregunta, el motor proporcionará la documentación que contenga las palabras exactas.
Las bases de datos trabajan con descriptores, por lo que estoy de acuerdo con los autores en enfocar el principal problema de los motores de búsqueda en la formulación de la pregunta, pues el usuario interroga desde un punto de vista conceptual.
Además, los resultados se ordenan aplicando el algoritmo term frecuency por inverse document frequency, es decir, a mayor número de ocurrencias y menor número de documentos con dichas ocurrencias, mayor relevancia del documento. Este hecho es quizá el que diferencia de una base de datos genérica y una jurídica, pues en Derecho la frecuencia no es un valor aplicable. Si estoy buscando una norma, quiero localizar el texto original antes que las modificaciones posteriores.
Bien es cierto que las bases de datos conocen sus limitaciones y han ido desarrollando sus softwares para poder mejorarlas, como por ejemplo: elaborando diccionarios semánticos (para incorporar sinónimos), identificando expresiones compuestas (para evitar el uso de comillas como operador booleano), incorporando abreviaturas, corrigiendo errores ortográficos simples, aplicando sugerencias predictivas de consultas y documentos, y creando los sumarios dinámicos (localizan directamente los términos buscados en los párrafos de los textos).
No obstante, los motores de búsqueda tienen todavía un largo recorrido para desarrollarse. Los autores confían en que la inteligencia artificial (IA) será fundamental para ello. El machine learning es una rama de la IA cuyo objetivo es desarrollar técnicas que permitan que los softwares aprendan proporcionando muchos ejemplos con la respuesta correcta (como haría un profesor con un alumno).
El problema para esta técnica es que el Derecho es una ciencia compleja que no solo se compone de reglas deductivas, también se aplican razonamientos inductivos y analógicos que en ocasiones pueden interpretarse como contradictorios y cuya actualización constante complica su gestión. Veremos qué nos deparará el futuro.