TwinLadder Nedēļas Apskats

Izdevums #8 | 2025. gada maijs

Redaktora piezīme

Harvey tikko izdarīja kaut ko tādu, kam vajadzētu likt katram juristam pārskatīt savu izpratni par MI rīkiem. 13. maijā uzņēmums paziņoja par Google un Anthropic modeļu integrāciju līdzās esošajai OpenAI infrastruktūrai. Harvey — viens no OpenAI ievērojamākajiem agrīni atbalstītajiem uzņēmumiem — faktiski paziņoja sava galvenā investora konkurentam: jūs mums arī esat vajadzīgi.

Šis nav tehnoloģijas stāsts. Šis ir tirgus varas stāsts. Kad juridiskā MI platforma ar visdziļākajām OpenAI attiecībām nolemj, ka neviens atsevišķs modelis nav pietiekami labs, tas signalizē kaut ko tādu, kas praktiķiem jāsaprot: laikmets "kuru MI mums lietot?" ir beidzies. Jautājums tagad ir "kuru MI mums lietot šim konkrētajam uzdevumam?"

Apspriedu to ar Edgaru Rozentālu, kurš seko aģentiskajām MI sistēmām un daudzmodeļu arhitektūrām. Viņa novērojums bija ass: "Brīdī, kad Harvey atsaistījās no viena modeļa nodrošinātāja, viņi signalizēja, ka inteliģences slānis ir prece. Vērtība ir orķestrēšanā — zinot, kuru dzinēju lietot kuram juridiskajam uzdevumam. Lielākā daļa biroju vēl diskutē, vai vispār ieviest MI. Harvey jau sen ir pāri šim jautājumam."

Ja Harvey ar visiem saviem resursiem ir nepieciešami trīs dažādi dzinēji, lai labi apkalpotu savus klientus, ko tas mums saka par viena modeļa rīkiem, ko lietojam mēs pārējie?

Kāpēc Harvey izvēlējās daudzmodeļu pieeju (un ko tas nozīmē jūsu birojam)

BigLaw Bench rezultāti

Harvey BigLaw Bench testēšana atklāja kaut ko tādu, ko piegādātāju mārketings apslēpj: dažādi modeļi ir labi dažādās lietās, un atšķirībām juridiskajā darbā ir nozīme.

Gemini 2.5 Pro izceļas dokumentu sagatavošanā un spēj apstrādāt vairāk nekā miljonu tokenu konteksta — tas nozīmē veselas darījumu datu telpas, nevis tikai atsevišķus dokumentus. Taču tas cīnās ar tiesvedības sagatavošanu un sarežģītu pierādījumu noteikumu argumentāciju, piemēram, dzirdēšanas izņēmumiem. Claude 3.7 Sonnet un OpenAI o1 labāk tiek galā ar sarežģītu argumentāciju un pierādījumu analīzi, bet tiem trūkst konteksta loga masveida dokumentu pārskatīšanai. Platforma tagad novirza uzdevumus uz to modeli, kas vislabāk darbojas konkrētajam juridiskā darba veidam.

Modelis	Stiprā puse	Ierobežojums
Gemini 2.5 Pro	Dokumentu sagatavošana, 1M+ tokenu konteksts	Vājāks pierādījumu argumentācijā
Claude 3.7 Sonnet	Sarežģīta argumentācija, niansēta analīze	Mazāks konteksta logs
OpenAI o1	Strukturēta juridiskā argumentācija	Mazāk efektīvs masveida dokumentu pārskatīšanā
Harvey maršrutēšanas slānis	Uzdevumam optimizēta modeļa izvēle	Necaurspīdīgs galalietotājam

Praktiķiem sekas ir nozīmīgākas, nekā tehniskie detaļi liek domāt.

Četras sekas, kas ir svarīgas

Pirmkārt, modeļu komodizācija paātrinās. Ja Harvey uztver modeļus kā aizvietojamus komponentus, ko izvēlas pēc uzdevuma, vērtība ir maršrutēšanas inteliģencē un juridiskajā apmācības slānī — nevis tajā, kurš pamatmodelis atrodas zem tā. Tas nozīmē, ka jūsu pašreizējā piegādātāja prezentācija "mēs lietojam GPT-4" kļūst arvien bezjēdzīgāka. Jautājiet labāk: kā jūs izvēlaties pareizo modeli pareizajam uzdevumam?

Otrkārt, atkarība no viena piegādātāja ir riska faktors. Kad OpenAI piedzīvo pārtraukumu, viena modeļa platformas apstājas. Daudzmodeļu arhitektūra nodrošina rezervi. Taču tā arī rada jaunas problēmas. Vidēja lieluma tiesvedības birojs ziņoja, ka Harvey novirzīja sarežģītu pierādījumu argumentu uz Claude, nevis GPT-4, un argumentācijas dziļums dramatiski uzlabojās. Labs rezultāts. Taču trīs nedēļas vēlāk tāda paša veida uzvedne deva stilistiski atšķirīgu analīzi, jo tika izvēlēts cits modelis. Partneris teica: "Es nevaru izveidot muskuļu atmiņu par to, ko rīks rada. Katra reize ir kā darbs ar citu juristu."

Treškārt, audita ceļš tikko kļuva sarežģītāks. Kad klients apšauba rēķinu par MI palīdzētu izpēti, "MI to izdarīja" jau bija nepietiekami. "Divi dažādi MI to izdarīja, un mēs nevaram skaidri paskaidrot, kurš ko darīja" — tas ir vēl sliktāk. Daudzmodeļu iespēja ir atbilstības un izskaidrojamības izaicinājums, ar ko biroji vēl nav tikuši galā. Eiropas birojiem, uz kuriem attiecas ES MI regulas caurspīdīguma pienākumi saskaņā ar 13. un 14. pantu, šī necaurspīdīgums nav vienkārši neērtība — tas ir regulatīvs risks. [MODERATE CONFIDENCE]

Un ceturtkārt, jūsu uzvedņu inženierija var izrādīties bezjēdzīga. Kāds birojs Frankfurtē ievērojami ieguldīja GPT-4 optimizētās uzvedņu bibliotēkās. Kad Harvey sāka novirzīt uzdevumus uz Claude un Gemini, šīs rūpīgi izstrādātās uzvednes deva nekonsekventus rezultātus. Atbildīgais jurists to raksturoja kā "būtībā sākam no nulles." Uzvedņu inženierija nav modeļu agnostiska, un daudzmodeļu platformas var prasīt daudzmodeļu uzvedņu izstrādi.

Novērtējuma jautājums

Harvey 40x ieņēmumu reizinātājs — 3 miljardu dolāru novērtējums ar aptuveni 75 miljonu dolāru gada regulārajiem ieņēmumiem — ir saprotamāks šajā gaismā. Likme nav uz kādu konkrētu MI modeli. Tā ir uz Harvey spēju uzbūvēt orķestrēšanas slāni starp modeļiem un juridisko darbu. Vai šis orķestrēšanas slānis ir 40x ieņēmumu vērts — tas ir riska kapitāla jautājums, nevis juridisko tehnoloģiju jautājums. Man ir šaubas. Taču pamatā esošā spēja ir reāla.

Rādītājs	Harvey	Tirgus konteksts
Novērtējums	$3 mljrd. (2025. g. maijs)	Augstākais juridiskā MI novērtējums pasaulē
Aplēstie gada ieņēmumi	~$75M	Ieņēmumu reizinātājs: ~40x
Korporatīvie klienti	300+ 53 valstīs	Iknedēļas aktīvie lietotāji aug 4x gadā
Am Law 100 iespiešanās	40+ biroji	~40% no augstākā līmeņa
Publiskā SaaS norma	—	6-12x ieņēmumu reizinātājs

Edgars Rozentāls pievieno tehnisku piezīmi, ko vērts dzirdēt: "Daudzmodeļu maršrutēšana ir aģentiskās arhitektūras sākums. Šodien Harvey izvēlas labāko modeli katram uzdevumam. Rīt tas saķēdēs modeļus kopā — vienu izpētei, otru dokumentu sagatavošanai, trešo verifikācijai. Biroji, kas sapratīs šo progresiju, būs gatavi. Biroji, kas domās, ka daudzmodeļu pieeja ir vienkārši funkcionalitātes atjauninājums, būs pārsteigti." [HIGH CONFIDENCE]

Kompetences jautājums

Partnere lielā Eiropas birojā aprakstīja savu pieredzi pēc Harvey Gemini integrācijas: "Mēs ielādējām veselu datu telpu — divus tūkstošus dokumentu — un uzdevām jautājumus par visu kopumu. Tas, kas prasīja nedēļu, samazinājās līdz divām dienām." Iespaidīgi. Taču, kad jautāju, vai viņas juristi saprata dokumentus, par kuriem vaicāja, viņa vilcinājās.

Ir atšķirība starp atbildes atrašanu divos tūkstošos dokumentu un darījuma izpratni, ko šie dokumenti pārstāv. Konteksta logi kļūst lielāki. Spēja absorbēt un sintezēt tajos ietvertā nozīmi joprojām ir cilvēciska spēja. Jurists, kas spēj uzdot miljona tokenu modelim izvilkt katru kontroles maiņas klauzulu visā datu telpā, ir veicis mehānisku uzdevumu. Jurists, kas saprot, kāpēc šī kontroles maiņas klauzula ir svarīga pircēja integrācijas stratēģijas, mērķa uzņēmuma galveno darbinieku noturēšanas interešu un regulatīvo seku kontekstā trīs ES jurisdikcijās — šis jurists ir izrādījis spriedumspēju.

Kad jūsu rīki kļūst dramatiski jaudīgāki, kārdinājums ir ļaut tiem darīt vairāk. Daudzmodeļu maršrutēšana nozīmē, ka MI var veikt dokumentu sagatavošanu, argumentāciju un liela mēroga pārskatu ar pieaugošu izsmalcinātību. Ko tas nespēj — ir pateikt jūsu juristam, kad analīze ir kļūdaina tādā veidā, kas ir komerciāli svarīgs, bet nav juridiski nozīmīgs. Klauzula ir tehniski atbilstoša. Darījums tik un tā nedarbosies. Tā ir spriedumspējas plaisa, un lielāki konteksta logi padara to vieglāk nepamanīt.

Ko darīt

Uzdodiet saviem MI piegādātājiem modeļa jautājumu. "Kurus modeļus tas lieto?" un "Kā tas izlemj, kurš modelis apkalpo kuru uzdevumu?" Ja viņi nespēj skaidri atbildēt, viņi par to nav nopietni domājuši.
Testējiet konsekvenci. Izpildiet to pašu uzvedni trīs reizes dažādās dienās. Ja iegūstat būtiski atšķirīgus rezultātus, ņemiet vērā, ka daudzmodeļu maršrutēšana (vai modeļu atjauninājumi) var būt iemesls. Veidojiet darba procesus, kas pielāgojas mainībai, nevis pieņem vienveidību.
Stipriniet audita dokumentāciju. Ja jūsu platforma lieto vairākus modeļus, jūsu ierakstiem jāatspoguļo, kurš modelis radīja kuru rezultātu. Profesionālās atbildības un atbilstības nolūkos — un jo īpaši ES MI regulas caurspīdīguma prasībām — "MI to uzrakstīja" nav pietiekami. Jums jāzina, kurš MI.
Nepārbūvējiet uzvedņu bibliotēkas akli. Pirms ieguldāt modeļu specifiskā uzvedņu inženierijā, novērtējiet, vai jūsu platforma vispār atklāj modeļa izvēli. Ja maršrutēšana ir automātiska un necaurspīdīga, optimizēšana konkrētam modelim ir veltīga.
Izvērtējiet daudzmodeļu platformas pret savu faktisko praksi. Birojiem ar šaurām, paredzamām darba plūsmām viena modeļa vienkāršība var pārspēt maršrutēšanas ieguvumus. Daudzveidīgām praksēm, kas apkalpo visu — no procesuālajiem dokumentiem līdz padziļinātai izpētei — uzdevumam optimizēta maršrutēšana sniedz izmērāmu uzlabojumu. Saskaņojiet rīka arhitektūru ar savām vajadzībām.

Ātrā lasāmviela

Harvey izaugsmes rādītāji: vairāk nekā 300 korporatīvo klientu 53 valstīs, iknedēļas aktīvo lietotāju skaits aug 4x gadā, vairāk nekā 40 Am Law 100 biroju. Platformas tirgus pozīcija ir būtiska neatkarīgi no tā, kā vērtējat novērtējumu.
TechCrunch pasniedz paziņojumu kā Anthropic un Google uzvaru pār OpenAI — konkurences dinamika starp pamatmodeļu nodrošinātājiem pārveido korporatīvo juridisko MI ātrāk, nekā lielākā daļa biroju seko līdzi.
Gan Anthropic, gan Google modeļi ir integrēti caur AWS Bedrock un Google Vertex ar līdzvērtīgām korporatīvajām drošības garantijām — Azure ekskluzivitātes ēra juridiskā MI infrastruktūrā tuvojas beigām.
Sacra aplēš Harvey gada regulāros ieņēmumus virs $75M — iespaidīga izaugsme, taču joprojām 40x ieņēmumu reizinātājs pie pašreizējā $3 miljardu novērtējuma. Korporatīvais juridiskais MI ir likme uz nākotni ar atbilstošu cenu.

Viens jautājums

Ja vadošajai juridiskajai MI platformai ir nepieciešami trīs dažādi MI dzinēji, lai adekvāti apkalpotu savus klientus, cik pārliecinātam jums vajadzētu būt par viena modeļa rīku, ko jūsu birojs iegādājās pagājušajā gadā?

TwinLadder Nedēļas Apskats | Izdevums #8 | 2025. gada maijs

Palīdzam profesionāļiem veidot MI kompetenci caur godīgu izglītību.