Harvey: Memvalidasi Penalaran Hukum Tingkat Lanjut Pratinjau Gemini 2.5 Pro dengan BigLaw Bench

Niko Grupen

Head of Applied AI

Vishal Dharmadhikari

AI DevRel

Harvey: Memvalidasi Penalaran Hukum Tingkat Lanjut Pratinjau Gemini 2.5 Pro dengan BigLaw Bench

Industri hukum memerlukan solusi AI yang dapat memproses informasi kompleks dalam jumlah besar dengan presisi dan nuansa yang tepat. Tolok ukur AI tradisional sering kali tidak dapat mencakup tuntutan praktik hukum di dunia nyata, sehingga sulit untuk mengidentifikasi model yang benar-benar mampu melakukan pekerjaan hukum bernilai tinggi. Harvey, sebuah startup dinamis yang berfokus untuk mengubah alur kerja hukum melalui AI, menghadapinya dengan mengembangkan BigLaw Bench, framework komprehensif mereka untuk menilai performa Model Bahasa Besar (LLM) pada tugas yang mencerminkan pekerjaan hukum sebenarnya. Dalam evaluasi ketat baru-baru ini, Pratinjau Gemini 2.5 Pro muncul sebagai yang berperforma paling unggul, yang menunjukkan potensi luar biasa untuk meningkatkan efisiensi dalam domain hukum utama.

Pratinjau Gemini 2.5 Pro di BigLaw Bench

Evaluasi terbaru Harvey yang memanfaatkan framework BigLaw Bench telah menunjukkan dengan jelas bahwa Pratinjau Gemini 2.5 Pro menunjukkan kemahiran yang luar biasa dalam tugas penalaran hukum inti dan, khususnya, tugas yang memerlukan penalaran atas input atau output hukum bentuk panjang. Seperti yang ditunjukkan dalam hasil yang dibagikan secara publik oleh Harvey, yang diperoleh dengan menguji model termasuk Pratinjau Gemini 2.5 Pro melalui API masing-masing, Pratinjau Gemini 2.5 Pro mencapai skor tertinggi sebesar 85,02% di BigLaw Bench, yang mengungguli model lain yang dievaluasi dalam penilaian komprehensif ini.

Teks alternatif: Diagram batang berjudul

Kemampuan terdepan ini sangat penting untuk berbagai aktivitas hukum bernilai tinggi. Tugas evaluasi utama dalam BigLaw Bench menunjukkan keunggulan Pratinjau Gemini 2.5 Pro:

Uji tuntas transaksional: Pratinjau Gemini 2.5 Pro menunjukkan kapasitas yang kuat untuk mengekstrak dan meringkas ketentuan penting (misalnya, penetapan, ganti rugi, klausul pengakhiran) dari beberapa perjanjian layanan yang panjang. Hal ini menunjukkan potensi signifikan untuk menyederhanakan proses peninjauan dokumen manual yang memakan waktu.
Penyusunan transaksi: Model ini dengan mahir menghasilkan analisis komparatif yang komprehensif dan terstruktur dengan baik untuk opsi keuangan yang rumit (misalnya, PIPE, penawaran ekuitas yang dijamin, penawaran obligasi). Model ini menunjukkan potensi dalam menyajikan informasi ini dengan cara yang jelas dan mudah diakses, bahkan bagi mereka yang tidak memiliki keahlian keuangan mendalam, serta dalam menyarankan item tindakan langsung yang potensial.
Pembuatan draf litigasi: Saat dinilai berdasarkan tugas yang terkait dengan litigasi, Pratinjau Gemini 2.5 Pro menunjukkan kemampuan yang luar biasa dalam membuat garis besar mendetail untuk dokumen argumen hukum berdasarkan sejumlah besar dokumen ringkasan. Kemampuan ini menunjukkan masa depan ketika AI dapat secara signifikan membantu dalam tahap awal pengembangan dan pengorganisasian argumen hukum.
Peninjauan & analisis dokumen: Evaluasi yang melibatkan peninjauan dokumen persidangan yang berbeda-beda (log panggilan, email, memorandum) mengungkapkan keunggulan Gemini 2.5 Pro Preview dalam membuat ringkasan peristiwa kronologis yang koheren. Selain itu, model ini menunjukkan potensi dalam mengidentifikasi inkonsistensi dan ambiguitas penting dalam catatan, yang merupakan aspek penting dari analisis hukum yang menyeluruh.

Dalam evaluasi ini, Pratinjau Gemini 2.5 Pro menunjukkan kemampuan penalaran yang kuat di berbagai input yang terdiri dari ratusan halaman materi, yang merupakan skenario umum dalam pekerjaan hukum. Selain itu, model ini mampu menggunakan materi tersebut untuk menghasilkan output yang lebih panjang dan komprehensif, sehingga memungkinkan insight dan analisis yang lebih mendalam. Kemampuan inti ini menyoroti potensi pemanfaatan Pratinjau Gemini 2.5 Pro dalam pekerjaan hukum yang kompleks yang memerlukan penalaran atas sekumpulan besar dokumen untuk mendukung kasus penggunaan ketelitian, peninjauan, dan pembuatan draf.

Standar Baru untuk AI Hukum

"Di Harvey, kami berkomitmen untuk melengkapi profesional hukum dengan alat tercanggih," kata Niko Grupen, Head of Applied AI di Harvey. "Evaluasi kami terhadap Pratinjau Gemini 2.5 Pro melalui BigLaw Bench telah mengungkapkan kemampuannya yang luar biasa dalam menyintesis informasi hukum yang kompleks. Insight ini mendorong visi kami untuk pengembangan produk di masa mendatang, di mana kami berupaya memanfaatkan keunggulan ini untuk mencapai efisiensi yang belum pernah ada sebelumnya dan memungkinkan pengacara berfokus pada pekerjaan strategis yang lebih penting."

Membuka Masa Depan Kerja Hukum

Komitmen Harvey terhadap evaluasi yang ketat dan analisis mendalamnya terhadap model AI canggih seperti Pratinjau Gemini 2.5 Pro menunjukkan potensi transformatif AI di bidang hukum. Temuan mereka membuka jalan bagi inovasi di masa mendatang yang berpotensi mengubah cara para profesional hukum menangani tugas-tugas yang paling menantang.

Untuk mempelajari bagaimana kemampuan penalaran dan sintesis canggih Gemini 2.5 Pro Preview dapat mendukung aplikasi Anda sendiri, buka dokumentasi Gemini API atau mulai di Google AI Studio.

Harvey adalah peserta Google AI Futures Fund yang berinvestasi dan berkolaborasi dengan startup ambisius yang membangun inovasi AI berikutnya.

Harvey: Memvalidasi Penalaran Hukum Tingkat Lanjut Pratinjau Gemini 2.5 Pro dengan BigLaw Bench

Harvey: Memvalidasi Penalaran Hukum Tingkat Lanjut Pratinjau Gemini 2.5 Pro dengan BigLaw Bench

Pratinjau Gemini 2.5 Pro di BigLaw Bench

Standar Baru untuk AI Hukum

Membuka Masa Depan Kerja Hukum

Studi kasus terkait