"Spogulis un migla" --- kad 99,8% precizitāte saduras ar realitāti

Twin Ladder Casebook sērija | Twin Ladder | 2026. gada februāris

Kāpēc MI projekti, kas laboratorijā darbojas nevainojami, sabrūk ražošanas vidē --- un ko Twin Ladder ietvars atklāj par pamatu, kuru lielākā daļa organizāciju izlaiž.

Ievads

Datu zinātniece vidēja izmēra ražošanas uzņēmumā atver klēpjdatoru un ieraudzī zaļi kvēlojošu informācijas paneli. Prognozējošās apkopes modelis, kuru viņa veidojusi deviņus mēnešus, testa kopā uzrāda 99,8 procentu precizitāti. Precizitāte, atsaukums, F1 --- katrs rādītājs ir izcils. Komanda svin. Vadība iekļauj rezultātus valdes prezentācijā. Ieviešanas datums ir noteikts.

Trīs mēnešus vēlāk tas pats modelis produkcijā strādā ar 45 procentu precizitāti. Sūkņi, kuriem vajadzēja signalizēt par gultņu nodilumu, sabojājas bez brīdinājuma. Sensori, kas apmācības laikā nodrošināja tīrus un konsekventus datus, tagad dreifē, ir nepareizi kalibrēti vai pilnībā bezsaistē. Vēsturiskā datu kopa, kas nodrošināja modeļa izcilo testa veiktspēju, kā izrādās, bija sakārtota un kurēta inženieru rokām --- viņi klusi aizpildīja iztrūkumus, balstoties uz savu pieredzi, kas nekad nebija iekodēta datos. Modelis neiemācījās bojājumu fiziku. Tas iemācījās datu kopas likumsakarības, kura vairs nepastāvēja brīdī, kad šie inženieri pārstāja to uzturēt.

Datu zinātniece nebija kļūdījusies. Modelis nebija kļūdījies. Spogulis vienkārši bija aizmiglojis, un neviens nepārbaudīja, vai atspulgs atbilst realitātei.

Stāsts

3,8 miljardu dolāru pamošanās

gadā 3,8 miljardu dolāru vērts rūpnieciskais ražotājs uzsāka ambiciozu MI programmu: desmit projekti, kas aptver prognozējošo apkopi, kvalitātes pārbaudi, pieprasījuma prognozēšanu un piegādes ķēdes optimizāciju. Uzņēmums ieguldīja labākajā infrastruktūrā, pieņēma darbā pieredzējušas datu zinātnes komandas un sadarbojās ar vadošo mākoņpakalpojumu sniedzēju. Astoņi no desmit projektiem nesasniedza ražošanas posmu.

Neveiksmes neizrietēja no neadekvātiem algoritmiem vai nepietiekamas skaitļošanas jaudas. Tās izrietēja no datiem. McKinsey analīze par MI ieviešanu ražošanā atklāja, ka izplatītas datu kvalitātes problēmas --- trūkstoši datu punkti, bojāti vai nepareizi kalibrēti sensori, nepilnīgas datu vārdnīcas, nesaderīgas sistēmas un nepietiekama izpratne par esošajiem datu avotiem --- konsekventi grauj pat labi finansētas iniciatīvas. Vienā dokumentētā gadījumā dzelzsrūdas uzņēmums sāka veidot procesu optimizētāju, bet jau pirmajās projekta dienās atklāja, ka modelim kritisks sensors bijis bojāts sešus mēnešus. Neviens to nebija pamanījis, jo operatori kompensēja manuāli, pielāgojot parametrus, balstoties uz gadu desmitu uzkrāto pieredzi, kas nekad nebija fiksēta nevienā datubāzē.

Tas nav atsevišķs gadījums. McKinsey ziņo, ka pēdējo desmit gadu laikā MI un mašīnmācīšanās sistēmas ir attīstījušās ātrāk nekā datu pārvaldība, padarot datu kvalitāti par galveno šķērsli disruptīvai inovācijai ražošanā. Tikai pieci procenti ražošanas funkciju bija pieņēmušas MI līdz 2024. gadam, un līdz pat 95 procentiem operatīvo datu joprojām netiek izmantoti --- tie ir fragmentēti starp nesaderīgām sistēmām, ieslēgti papīra procesos vai glabāti formātos, kurus neviena mašīnmācīšanās sistēma nespēj apstrādāt.

NHS Foresight pauze

Šī likumsakarība sniedzas tālu ārpus ražošanas. 2025. gada vidū NHS England apturēja savu Foresight MI projektu --- ģeneratīvo modeli, kas apmācīts ar deidentificētiem ierakstiem no 57 miljoniem pacientu, izstrādāts sadarbībā ar University College London un King's College London. Modeļa mērķis bija prognozēt nākotnes veselības iznākumus pacientu populācijām visā Anglijā, nodrošinot agrāku klīnisku iejaukšanos.

Tehnoloģija darbojās. Pārvaldība --- nedarbojās. British Medical Association un Royal College of General Practitioners atklāja, ka ģimenes ārstu dati, kas sākotnēji vākti COVID-19 pētniecībai, tika pārizmantoti modeļa apmācībai bez pienācīgas caurskatāmības. Ģimenes ārstu vadītāji paziņoja, ka nav skaidrs, vai tika ievērotas "pareizas procedūras", lai nodrošinātu datu kopīgošanu "atbilstoši pacientu gaidām." Komiteja lūdza NHS England pašai vērsties pie Informācijas komisāra un piesardzības nolūkos apturēt visu datu apstrādi.

Foresight netika apturēts tāpēc, ka algoritms bija kļūdains. Tas tika apturēts tāpēc, ka datu pamats --- izcelsmes dokumentācija, piekrišanas ietvars un pārvaldības arhitektūra zem modeļa --- nebija veidots atbilstoši lietojuma gadījuma prasībām. Spogulis tehniski funkcionēja, bet neviens nebija pārliecinājies, ka dati, kas to baroja, bija iegūti un pārvaldīti tā, lai izturētu regulatīvu pārbaudi.

SAP S/4HANA: kad migrācija satiek realitāti

Uzņēmumu resursu plānošanas migrācijas stāsta to pašu stāstu citā mērogā. Neatkarīgi pētījumi liecina, ka vairāk nekā 60 procenti SAP S/4HANA migrācijas programmu neatbilst izmaksu, grafika vai kvalitātes mērķiem. Deviņdesmit procenti pabeigto migrāciju pārsniedza sākotnējos termiņus. Sešdesmit pieci procenti vadītāju atzina, ka nav sasniegti sākotnējie kvalitātes mērķi. Projekti aizņem vidēji par 30 procentiem ilgāku laiku nekā sākotnēji plānots, ar izmaksu pārsniegumiem, kas kaskādē ietekmē katru nākamo iniciatīvu, kas bija atkarīga no jaunās platformas darbības.

Galvenais iemesls ir konsekvents: netīri dati. Dublēti piegādātāju ieraksti, trūkstoši materiālu atribūti, nekonsekventi klientu pamatfaili --- problēmas, kas uzkrājušās gadu gaitā mantotajās sistēmās, kļūst katastrofālas, pārejot uz platformu, kas piemēro stingrākas datu struktūras. Pētniecības firma CODA Technology Solutions ziņo, ka 70 procenti ERP migrāciju cieš neveiksmi nevis programmatūras dēļ, bet gan migrējamo datu dēļ. Migrācija nerada problēmu. Tā to atklāj. Organizācijas atklāj --- bieži vien tiešsaistes palaišanas brīdī ---, ka dati, kurus tās uzskatīja par uzticamiem, turējās kopā tikai pateicoties to cilvēku klusajai zināšanai, kas ar tiem strādāja katru dienu --- zināšanai, kuru neviens migrācijas rīks nespēj iegūt. Piegādātāju pamatfails, kas mantotajā sistēmā izskatās tīrs, izrādās satur trīs ierakstus par vienu un to pašu piegādātāju ar nedaudz atšķirīgiem nosaukumiem. Materiālu pamatfails, kas darbojies desmit gadus, nesatur atribūtus, kurus prasa jaunā sistēma. Katra nepilnība datos ir nepilnība spogulī.

Likumsakarība visos trīs gadījumos ir identiska. Tehnoloģija nav neveiksmes punkts. Datu pamats ir. Un datu pamats katrā gadījumā ir cilvēciska problēma, kas maskējas par tehnisku.

Caur Twin Ladder prizmu

Twin Ladder ietvars, ieviests darbā The Competence Paradox (Twin Ladder, 2026), apraksta četrus organizācijas MI brieduma līmeņus. 0. līmenis ir MI lietpratības pamats --- bāzes spēja kritiski izvērtēt MI rezultātus. 1. līmenis atspoguļo individuālās lomas ar MI aģentiem. 2. līmenis veido uzņēmējdarbības funkciju digitālos dubultniekus. 3. līmenis modelē veselas vērtību ķēdes.

Šajā rakstā aprakstītie gadījumi atrodas zem 0. līmeņa. Tās nav MI lietpratības vai profesionālās kompetences neveiksmes. Tās ir neveiksmes pamata līmenī, uz kura kāpnes stāv. Datu gatavība nav kāpņu pakāpiens. Tā ir grīda.

Metafora, kas vada šo rakstu, ir precīza: jūsu MI dvīnis var būt tikai tik skaidrs, cik spogulis, kurā tas skatās. Ja datu spogulis ir aizmiglojis --- nepilnīgs, sadalīts silosu struktūrās, nepārvaldīts, atrauts no operatīvās realitātes, kuru tas apgalvo atspoguļojam --- dvīnis rada izkropļotus atspulgus. Šie atspulgi izskatās kompetenti. Tie uzrāda 99,8 procentus kontrolētā vidē. Tie ģenerē pārliecinošas prognozes, noslīpētus informācijas paneļus un pārliecinošas valdes prezentācijas. Bet tie ir nepareizi, un organizācijai trūkst datu pamata, lai zinātu, ka tie ir nepareizi, līdz brīdim, kad sekas iestājas.

3,8 miljardu dolāru ražotājam nebija modeļa problēma. Tam bija spoguļa problēma. Dzelzsrūdas uzņēmumam nebija optimizācijas problēma. Tam bija sensors, kas bijis bojāts sešus mēnešus --- un datu arhitektūra, kas nespēja atšķirt reālus mērījumus no fantoma rādījumiem. NHS Foresight nebija MI problēma. Tā bija izcelsmes problēma: dati spogulī bija nonākuši pa kanāliem, kas nevarēja izturēt pārvaldības pārbaudi.

Datu gatavība nav tehnoloģiska problēma. Tā ir kompetences priekšnoteikums. Organizācija nevar izvērtēt MI rezultātus (0. līmenis), ja dati, kas baro šos rezultātus, ir neuzticami. Tā nevar izveidot profesionālo dvīni (1. līmenis), ja dati, kas apraksta profesionāļa jomu, ir nepilnīgi. Tā nevar izveidot operatīvo dvīni (2. līmenis), ja operatīvie dati ir sadalīti starp nesaderīgām sistēmām. Un tā nevar modelēt ekosistēmu (3. līmenis), ja dati, kas plūst starp dalībniekiem, ir nepārvaldīti.

Aplūkosim sekas pašam Kompetences paradoksam. Paradokss nosaka, ka MI rīki, kas paātrina individuālo sniegumu, vienlaicīgi degradē cilvēciskās spējas, no kurām organizācijas ir atkarīgas. Bet datu gatavības problēma ievieš vēl fundamentālāku risku: ja dati ir aizmigloti, organizācija pat nespēj noteikt, vai tās MI darbojas labi vai slikti. Atgriezeniskā saite, kas ļautu cilvēkiem mācīties no MI rezultātiem --- salīdzināt, apšaubīt un kalibrēt ---, ir bojāta jau pie avota. Spogulis ne tikai izkropļo. Tas izkropļo veidā, kas izskatās precīzs, radot viltus pārliecību, kas grauj to pašu kritisko spriedumspēju, ko Twin Ladder ir paredzēts veidot.

Twin Ladder kāpnes kāpj, nevis izlaiž. Bet pirms pirmā pakāpiena grīdai jābūt stabilai. Datu gatavība ir šī grīda.

Likumsakarība

Trīs strukturālas nepilnības izskaidro, kāpēc MI projekti, kas laboratorijā gūst panākumus, produkcijā sabrūk.

Testa-produkcijas plaisa. Laboratorijas datu kopas ir tīras, kurētas un statiskas. Ražošanas vides ir trokšņainas, dinamiskas un nepilnīgas. McKinsey dokumentēja gadījumus, kuros sensoru datu padziļināta pārskatīšana prognozējošiem modeļiem atklāja "desmitiem papildu sīku kļūdu tajā, kā sensori tika interpretēti un iekļauti" --- kļūdas, kas neredzamas vēsturiskajos datos, bet postošas reāllaika ieviešanā. Bija nepieciešams dinamisks pārkalibrēšanas algoritms, lai koriģētu drejfējošus tiešsaistes analizatoru mērījumus, kas pēc tam bija jāpiemēro atpakaļejoši visai vēsturiskajai datu kopai. Plaisa starp testu un produkciju nav plaisa modeļa arhitektūrā. Tā ir plaisa datu uzticamībā.

Cilšu zināšanu plaisa. Pētījumi lēš, ka 70 procenti kritisko operatīvo zināšanu ražošanā ir cilšu zināšanas --- nekad nav pierakstītas, nekad formāli mācītas un pastāvīgi pakļautas zaudēšanas riskam, kad cilvēks, kas tās nes, aiziet no organizācijas. Aptuveni 50 procenti operatīvo darbību ir dokumentēti tikai mutiski vai kā neizteikti ieradumi. Tajā pašā laikā 25 procenti ražošanas darbaspēka ir vecāki par 55 gadiem, un ASV katru dienu pensionējas 10 000 bēbīburmeru paaudzes pārstāvju. Zināšanas, kas padara datus interpretējamus --- izpratne, ka 14. sensors dreifē, kad apkārtējā temperatūra pārsniedz 35 grādus, ka piegādātāja B materiāls mitrā vidē uzvedas citādi, ka otrdienas nakts maiņa darbina līniju ātrāk konkrēta operatora tehnikas dēļ --- pamet pa durvīm. Katrs aiziešanas gadījums vēl vairāk aizmiglo spoguli.

80/20 problēma. Analītiķi lēš, ka 80 procenti uzņēmumu datu ir nestrukturēti: e-pasti, Slack ziņojumi, apkopes žurnāli, ar roku rakstītas piezīmes, mutiskas instrukcijas. MI sistēmas, kas apmācītas ar 20 procentiem strukturēto datu, veido savu izpratni, balstoties uz nelielu daļu operatīvās realitātes. Fivetran un Vanson Bourne aptauja uzņēmumu organizācijās atklāja, ka modeļi, kas apmācīti ar neprecīziem, nepilnīgiem un zemas kvalitātes datiem, izraisīja nepareizus lēmumus, kas organizācijām izmaksāja vidēji 406 miljonus dolāru gadā zaudētu ieņēmumu veidā --- sešus procentus no globālajiem gada ieņēmumiem. 2024. gada Forrester aptauja 500 uzņēmumu datu vadītājiem, ko pasūtīja Capital One, atklāja, ka 73 procenti identificēja "datu kvalitāti un pilnīgumu" kā galveno šķērsli MI panākumiem, ierindojot to augstāk par modeļa precizitāti, skaitļošanas izmaksām un talantu trūkumu.

Likumsakarība ir konsekventa: organizācijas investē algoritmā un atstāj novārtā substrātu. Tās pulē lēcu un ignorē miglu uz spoguļa.

Mācība

Pretpiemērs pastāv, un tas ir pamācošs.

Autobūves nozarē ražotāji, tostarp General Motors un Stellantis, pieņēma Neural Concept MI inženierijas platformu, kas iegulst intelekta slāni tieši virs esošajām datorizētās inženierijas sistēmām. Platforma uztver dizaina zināšanas, kas iepriekš atradās tikai vecāko inženieru galvās --- intuitīvo izpratni par aerodinamisku virsmu mijiedarbību, materiālu spriegumu sadalījumu slodzē un siltuma profilu maiņu dažādos ekspluatācijas apstākļos. Iekodējot šīs cilšu zināšanas MI apmācības datos, platforma nodrošina līdz pat 30 procentiem īsākus dizaina ciklus un prognozētus ietaupījumus 20 miljonu dolāru apmērā 100 000 vienību transportlīdzekļu programmai.

Iesmidzināšanas formēšanā globāls elektronikas ražotājs sadarbojās ar Arch Systems, lai digitalizētu cilšu zināšanas 60 iekārtu operācijā. Rūpnīcā bija 250 dīkstāves kodi, sadalīti 10 kategorijās. Pieredzējuši tehniķi ražošanas laiku tērēja pareizo klasifikāciju meklēšanai; jaunākie operatori minēja, radot datu nekonsekvences, kas padarīja patiesu veiktspējas analīzi neiespējamu. Standartizējot dīkstāves klasifikāciju ar MI vadītiem procesiem, ražotājs piecās nedēļās panāca 20,6 procentu uzlabojumu iekārtu pieejamībā, atbrīvojot 1,2 miljonus dolāru ikgadējos ietaupījumos vienā ražotnē un prognozējot 12,5 miljonus dolāru globāli 750 iekārtām.

Atšķirība starp šiem panākumiem un iepriekš dokumentētajām neveiksmēm nav algoritma sarežģītībā. Tā ir spoguļa kvalitātē. Veiksmīgās organizācijas sāka ar datiem. Tās uztva cilšu zināšanas, pirms tās pamet pa durvīm. Tās standartizēja haotiskos, no cilvēkiem atkarīgos procesus, kas padarīja to operatīvos datus neuzticamus. Tās notīrīja miglu, pirms lūdza spogulim atspoguļot.

Datu gatavība nav izmaksas. Tā ir vienīgais ceļš uz MI ieguldījumu atdevi. MIT NANDA pētījums atklāja, ka 95 procenti uzņēmumu MI pilotprojektu nesniedz izmērāmu biznesa atdevi. Fivetran pētījums dokumentē 406 miljonus dolāru vidējo gada ieņēmumu zaudējumos no MI modeļiem, kas veidoti uz sliktas kvalitātes datiem. Tās nav atsevišķas problēmas. Tā ir viena un tā pati problēma, mērīta dažādos mērogos. Katrs dolārs, kas iztērēts algoritmam, kurš uzņem aizmiglotus datus, ir dolārs, kas rada pārliecinošus, labi formatētus, precīzi nepareizus rezultātus.

Organizācijas, kas gūs vērtību no MI nākamajā desmitgadē, nav tās, kas izvieto vismodernākos modeļus. Tās ir tās, kas izveidoja datu pamatus, kas padara jebkuru modeli uzticamu. Tās ir tās, kas uzskatīja datu gatavību nevis par priekšdarbu, ko steigā veic ceļā uz ieviešanu, bet gan par pamata ieguldījumu, kas nosaka, vai ieviešana nes atdevi vai zaudējumus.

Sāciet ar datiem, nevis ar algoritmu. Notīriet spoguli, pirms lūdzat tam atspoguļot.

Pirmdienas rīta jautājums: Ja jūs šodien noņemtu katru cilvēcisku apvedceļu, manuālu korekciju un cilšu zināšanu saīsni no savām datu plūsmām, vai jūsu MI modeļi joprojām radītu tos pašus rezultātus --- vai arī migla ieveltos?

Avoti

MIT NANDA, The GenAI Divide: State of AI in Business 2025 --- 95% uzņēmumu MI pilotprojektu nesniedz izmērāmu atdevi; tikai 5% sasniedz ražošanu. Fortune coverage
McKinsey & Company, "Clearing Data-Quality Roadblocks: Unlocking AI in Manufacturing" --- Sensoru kalibrēšanas neveiksmes, dzelzsrūdas gadījuma izpēte, cilšu zināšanu kodēšana, datu kvalitāte kā galvenais inovācijas šķērslis. McKinsey
Fivetran and Vanson Bourne, AI in 2024 Survey --- Zema datu kvalitāte rada vidēji 406 miljonu dolāru gada ieņēmumu zaudējumus; 67% datu zinātnieku laika tiek veltīts datu sagatavošanai. Fivetran
NHS England / Digital Health, "AI Project to Predict Health Outcomes Paused Over GP Data Concern" --- Foresight modelis apmācīts ar 57 miljonu pacientu ierakstiem, apturēts datu pārvaldības un piekrišanas problēmu dēļ. Digital Health
Capital One / Forrester Research, 2024 Enterprise Data Leaders Survey --- 73% datu vadītāju min datu kvalitāti un pilnīgumu kā galveno šķērsli MI panākumiem. AI Data Analytics Network
CIO / SAP S/4HANA Migration Research --- 90% pabeigto migrāciju pārsniedza sākotnējos termiņus; 65% nesasniedza kvalitātes mērķus; netīri dati kā galvenais iemesls. CIO
Manual.to / Valere.io, "The Tribal Knowledge Crisis in Manufacturing" --- 70% kritisko operatīvo zināšanu ir cilšu zināšanas; 50% darbību dokumentētas tikai mutiski; 25% darbaspēka vecāki par 55 gadiem. Manual.to | Valere.io
Neural Concept / Manufacturing Dive --- GM un Stellantis pieņem MI inženierijas platformu; 20 miljonu dolāru prognozēti ietaupījumi 100 000 vienību transportlīdzekļu programmām. Manufacturing Dive
Arch Systems, "How AI Is Transforming Injection Molding: From Tribal Knowledge to $12.5M in Savings" --- 20,6% pieejamības uzlabojums piecās nedēļās; 12,5 miljonu dolāru prognozēti globālie ietaupījumi. Arch Systems

Šis raksts ir daļa no Twin Ladder Casebook sērijas, pavadošajiem materiāliem baltajai grāmatai The Competence Paradox, kuru izstrādājis Twin Ladder. Twin Ladder ir atvērts ietvars. Tas neprasa konkrētu piegādātāju, platformu vai konsultāciju uzņēmumu.