Harvey: Validación del razonamiento jurídico avanzado de la versión preliminar de Gemini 2.5 Pro con BigLaw Bench

Niko Grupen

Director de IA aplicada

Vishal Dharmadhikari

DevRel de IA

Imagen hero de la presentación de Toonsutra

Harvey: Validación del razonamiento jurídico avanzado de la versión preliminar de Gemini 2.5 Pro con BigLaw Bench

El sector legal exige soluciones de IA que puedan navegar por un inmenso volumen de información compleja con precisión y matices. Los parámetros de referencia tradicionales de la IA a menudo no logran captar las demandas del mundo real de la práctica jurídica, lo que dificulta la identificación de modelos verdaderamente capaces de realizar un trabajo jurídico de alto valor. Harvey, una startup dinámica dedicada a transformar los flujos de trabajo legales a través de la IA, abordó este problema desarrollando BigLaw Bench, su marco integral para evaluar el rendimiento de los modelos de lenguaje grandes (LLM) en tareas que reflejan el trabajo legal real. En sus recientes evaluaciones rigurosas, la versión preliminar de Gemini 2.5 Pro se destacó por su rendimiento, ya que demostró un potencial excepcional para mejorar la eficiencia en áreas legales clave.

La versión preliminar de Gemini 2.5 Pro supera a los principales modelos de BigLaw

Las evaluaciones recientes de Harvey con el marco de BigLaw Bench indicaron claramente que la versión preliminar de Gemini 2.5 Pro demuestra una notable competencia en las tareas de razonamiento jurídico básicas y, en particular, en las tareas que requieren razonamiento sobre entradas o salidas jurídicas de formato largo. Como se muestra en los resultados compartidos públicamente de Harvey, obtenidos a través de la prueba de modelos como Gemini 2.5 Pro Preview a través de sus respectivas APIs, Gemini 2.5 Pro Preview alcanzó la puntuación más alta del 85.02% en BigLaw Bench, superando a otros modelos evaluados en esta evaluación integral.

Texto alternativo: Gráfico de barras titulado

Esta capacidad líder es fundamental para una amplia variedad de actividades legales valiosas. Las tareas de evaluación clave dentro de BigLaw Bench mostraron las fortalezas de la versión preliminar de Gemini 2.5 Pro:

Diligencia debida transaccional: La versión preliminar de Gemini 2.5 Pro demostró una gran capacidad para extraer y resumir disposiciones críticas (p.ej., cláusulas de cesión, indemnización y rescisión) de varios acuerdos de servicio extensos. Esto sugiere un potencial significativo para optimizar el proceso manual de revisión de documentos, que requiere mucho tiempo.
Estructuración de transacciones: El modelo generó con destreza análisis comparativos integrales y bien estructurados de opciones financieras complejas (p.ej., PIPE, ofertas de capital suscritas, ofertas de bonos). El modelo demostró ser prometedor a la hora de presentar esta información de una manera clara y accesible, incluso para quienes no tienen una gran experiencia financiera, y de sugerir posibles acciones inmediatas.
Redacción de documentos para litigios: Cuando se evaluó en tareas relacionadas con litigios, Gemini 2.5 Pro Preview demostró una notable capacidad para generar esquemas detallados de resúmenes legales basados en grandes volúmenes de documentos informativos. Esta capacidad apunta a un futuro en el que la IA puede ayudar significativamente en las etapas iniciales de la organización y el desarrollo de argumentos legales.
Revisión y análisis de documentos: Las evaluaciones que involucraron la revisión de documentos de prueba dispares (registros de llamadas, correos electrónicos, memorandos) revelaron la capacidad de Gemini 2.5 Pro Preview para crear resúmenes cronológicos coherentes de los eventos. Además, el modelo demostró potencial para identificar inconsistencias y ambigüedades críticas dentro del registro, un aspecto crucial del análisis legal exhaustivo.

En estas evaluaciones, la versión preliminar de Gemini 2.5 Pro demostró una gran capacidad de razonamiento en entradas que constan de cientos de páginas de materiales, una situación común en el trabajo legal. Además, era capaz de usar estos materiales para generar resultados más completos y de formato más largo, lo que permitía obtener análisis y estadísticas más detallados. Estas capacidades principales destacan el potencial de aprovechar Gemini 2.5 Pro Preview en el trabajo legal complejo que requiere razonamiento sobre grandes conjuntos de documentos para respaldar los casos de uso de diligencia, revisión y redacción.

Un nuevo estándar para la IA jurídica

"En Harvey, nos comprometemos a proporcionar a los profesionales legales las herramientas más avanzadas", afirma Niko Grupen, jefe de IA aplicada en Harvey. "Nuestra evaluación de la versión preliminar de Gemini 2.5 Pro a través de BigLaw Bench reveló su notable capacidad para sintetizar información legal compleja. Esta estadística alimenta nuestra visión para el desarrollo de productos futuros, en la que buscamos aprovechar estas fortalezas para lograr una eficiencia sin precedentes y permitir que los abogados se enfoquen en el trabajo estratégico de más alto nivel".

Unlocking the Future of Legal Work

El compromiso de Harvey con la evaluación rigurosa y su análisis detallado de los modelos de IA de vanguardia, como la versión preliminar de Gemini 2.5 Pro, demuestran el potencial transformador de la IA en el campo legal. Sus hallazgos allanan el camino para futuras innovaciones que prometen reformar la forma en que los profesionales del derecho abordan sus tareas más exigentes.

Para explorar cómo las capacidades avanzadas de razonamiento y síntesis de la versión preliminar de Gemini 2.5 Pro pueden potenciar tus propias aplicaciones, visita la documentación de la API de Gemini o comienza a usar Google AI Studio.

Harvey participa en el Fondo para el Futuro de la IA de Google, que invierte en startups ambiciosas y colabora con ellas para crear el futuro de la IA.

Harvey: Validación del razonamiento jurídico avanzado de la versión preliminar de Gemini 2.5 Pro con BigLaw Bench

Harvey: Validación del razonamiento jurídico avanzado de la versión preliminar de Gemini 2.5 Pro con BigLaw Bench

La versión preliminar de Gemini 2.5 Pro supera a los principales modelos de BigLaw

Un nuevo estándar para la IA jurídica

Unlocking the Future of Legal Work

Casos de éxito relacionados