pagina_banner

nieuws

Sinds de oprichting van IBM Watson in 2007 zijn mensen continu bezig geweest met de ontwikkeling van medische kunstmatige intelligentie (AI). Een bruikbaar en krachtig medisch AI-systeem heeft een enorm potentieel om alle aspecten van de moderne geneeskunde te hervormen, slimmere, nauwkeurigere, efficiëntere en inclusievere zorg mogelijk te maken, het welzijn van medisch personeel en patiënten te verbeteren en daarmee de menselijke gezondheid aanzienlijk te verbeteren. Hoewel medische AI-onderzoekers zich de afgelopen 16 jaar in verschillende kleine vakgebieden hebben verzameld, zijn ze er tot nu toe nog niet in geslaagd sciencefiction werkelijkheid te laten worden.

Dit jaar heeft medische AI ​​op veel vlakken grote vooruitgang geboekt met de revolutionaire ontwikkeling van AI-technologie zoals ChatGPT. Een ongekende doorbraak in de mogelijkheden van medische AI: het tijdschrift Nature is continu bezig met onderzoek naar het medische groottaalmodel en het basismodel voor medische beelden; Google brengt Med-PaLM en zijn opvolger uit, waarmee het een expertniveau bereikt in de examenvragen van de Amerikaanse arts. Belangrijke wetenschappelijke tijdschriften richten zich op medische AI: Nature publiceert een vooruitblik op het basismodel van algemene medische AI; Na een reeks reviews van AI in de geneeskunde eerder dit jaar publiceerde het New England Journal of Medicine (NEJM) op 30 november zijn eerste review over digitale gezondheid en lanceerde het op 12 december het eerste nummer van het NEJM-subtijdschrift NEJM AI. De landingsbodem voor medische AI ​​is verder ontwikkeld: het JAMA-subtijdschrift publiceerde het wereldwijde initiatief voor het delen van medische beeldgegevens; de Amerikaanse Food and Drug Administration (FDA) ontwikkelt conceptrichtlijnen voor de regulering van medische AI.

Hieronder bespreken we de aanzienlijke vooruitgang die onderzoekers wereldwijd hebben geboekt op het gebied van bruikbare medische AI ​​in 2023.

801

Medisch AI basismodel

De constructie van een basismodel voor medische AI ​​is ongetwijfeld de populairste onderzoeksfocus van dit jaar. De tijdschriften van Nature hebben gedurende het jaar reviewartikelen gepubliceerd over het Universal Basic-model van de gezondheidszorg en het grote taalmodel van de gezondheidszorg. Medical Image Analysis, het toonaangevende tijdschrift in de branche, heeft de uitdagingen en kansen van onderzoek naar basismodellen in medische beeldanalyse besproken en ernaar uitgekeken, en het concept van "stamboom van basismodel" voorgesteld om de ontwikkeling van onderzoek naar basismodellen van medische AI ​​samen te vatten en te begeleiden. De toekomst van basis-AI-modellen voor de gezondheidszorg wordt steeds duidelijker. Voortbouwend op de succesvolle voorbeelden van grote taalmodellen zoals ChatGPT, met behulp van geavanceerdere zelfgestuurde pre-trainingsmethoden en een enorme accumulatie van trainingsgegevens, proberen onderzoekers op het gebied van medische AI ​​1) ziektespecifieke basismodellen, 2) algemene basismodellen en 3) multimodale grote modellen te bouwen die een breed scala aan modi integreren met enorme parameters en superieure mogelijkheden.

AI-model voor medische dataverzameling

Naast de grote AI-modellen die een belangrijke rol spelen in de downstream klinische data-analyse, is er ook technologie ontstaan ​​in de upstream klinische data-acquisitie, vertegenwoordigd door generatieve AI-modellen. Het proces, de snelheid en de kwaliteit van data-acquisitie kunnen aanzienlijk worden verbeterd door AI-algoritmen.

 

Eerder dit jaar publiceerde Nature Biomedical Engineering een studie van de Turkse Straits University, gericht op het gebruik van generatieve AI om het probleem van pathologische beeldondersteunde diagnose in klinische toepassingen op te lossen. Artefacten in vriescoupeweefsel tijdens een operatie vormen een obstakel voor snelle diagnostische evaluatie. Hoewel in formaline en paraffine ingebed (FFPE) weefsel een monster van hogere kwaliteit oplevert, is het productieproces ervan tijdrovend en duurt het vaak 12-48 uur, waardoor het ongeschikt is voor gebruik in de operatie. Het onderzoeksteam stelde daarom een ​​algoritme voor, genaamd AI-FFPE, dat het uiterlijk van het weefsel in de vriescoupe vergelijkbaar kan maken met FFPE. Het algoritme corrigeerde met succes de artefacten van vriescoupes, verbeterde de beeldkwaliteit en behield tegelijkertijd de klinisch relevante kenmerken. Bij klinische validatie verbetert het AI-FFPE-algoritme de diagnostische nauwkeurigheid van pathologen voor tumorsubtypen aanzienlijk, terwijl de klinische diagnosetijd aanzienlijk wordt verkort.

Cell Reports Medicine rapporteert over onderzoekswerk van een team van het Third Clinical College van de Universiteit van Jilin, de afdeling Radiologie, het Zhongshan Ziekenhuis, aangesloten bij de Fudan Universiteit, en de Shanghai University of Science and Technology [25]. Deze studie stelt een universeel deep learning en iteratief reconstructie-fusieframework (Hybrid DL-IR) voor met een hoge veelzijdigheid en flexibiliteit, dat uitstekende beeldreconstructieprestaties laat zien in snelle MRI, lage dosis CT en snelle PET. Het algoritme kan MR Single-organ multi-sequence scanning in 100 seconden uitvoeren, de stralingsdosis verminderen tot slechts 10% van de CT-afbeelding, ruis elimineren en kleine laesies reconstrueren uit PET-opnamen met een 2 tot 4 keer hogere versnelling, terwijl het effect van bewegingsartefacten wordt verminderd.

Medische AI ​​in samenwerking met medisch personeel

De snelle ontwikkeling van medische AI ​​heeft er ook toe geleid dat medische professionals serieus nadenken en onderzoeken hoe ze met AI kunnen samenwerken om klinische processen te verbeteren. In juli van dit jaar hebben DeepMind en een multi-institutioneel onderzoeksteam gezamenlijk een AI-systeem voorgesteld genaamd Complementary Driven Clinical Workflow Delay (CoDoC). Het diagnostische proces wordt eerst gediagnosticeerd door een voorspellend AI-systeem, vervolgens beoordeeld door een ander AI-systeem op basis van het eerdere resultaat, en bij twijfel wordt de diagnose uiteindelijk gesteld door een clinicus om de diagnostische nauwkeurigheid te verbeteren en de balansefficiëntie te balanceren. Wat borstkankerscreening betreft, verminderde CoDoC de percentages vals-positieven met 25% met hetzelfde percentage vals-negatieven, terwijl de werklast van clinici met 66% werd verminderd, vergeleken met het huidige "double-read arbitration"-proces in het VK. Wat betreft TB-classificatie werden de percentages vals-positieven met 5 tot 15 procent verminderd met hetzelfde percentage vals-negatieven in vergelijking met onafhankelijke AI en klinische workflows.

Nederlands Op dezelfde manier introduceerden Annie Y. Ng et al., van Kheiron Company in Londen, VK, extra AI-lezers (in samenwerking met menselijke onderzoekers) om de resultaten opnieuw te onderzoeken wanneer er geen recall-resultaten waren in het double-read arbitrageproces, wat het probleem van gemiste detectie bij vroege borstkankerscreening verbeterde, en het proces had bijna geen vals-positieve resultaten. Een andere studie, geleid door een team aan de University of Texas McGovern Medical School en uitgevoerd in vier beroertecentra, paste op computertomografie-angiografie (CTA) gebaseerde AI-technologie toe om de detectie van grote vasculaire occlusieve ischemische beroerte (LVO) te automatiseren. Clinici en radiologen ontvangen realtime meldingen op hun mobiele telefoons binnen enkele minuten nadat de CT-beeldvorming is voltooid, die hen op de hoogte stellen van de mogelijke aanwezigheid van LVO. Dit AI-proces verbetert de workflows in het ziekenhuis voor acute ischemische beroerte, waardoor de tijd van deur tot lies van opname tot behandeling wordt verkort en er kansen worden geboden voor succesvolle redding. De bevindingen zijn gepubliceerd in JAMA Neurology.

Een AI-zorgmodel voor universeel voordeel

In 2023 zal er ook veel goed werk worden verricht met behulp van medische AI ​​om kenmerken te vinden die onzichtbaar zijn voor het menselijk oog in gemakkelijker beschikbare data, wat universele diagnose en vroege screening op grote schaal mogelijk maakt. Begin dit jaar publiceerde Nature Medicine studies van het Zhongshan Eye Center van de Sun Yat-sen Universiteit en het Second Affiliated Hospital van de Fujian Medical University. Met behulp van smartphones als applicatieterminals gebruikten ze cartoonachtige videobeelden om de blik van kinderen te induceren en hun kijkgedrag en gezichtskenmerken vast te leggen. Daarnaast analyseerden ze afwijkende modellen met behulp van deep learning-modellen om 16 oogaandoeningen succesvol te identificeren, waaronder aangeboren staar, aangeboren ptosis en aangeboren glaucoom, met een gemiddelde screeningsnauwkeurigheid van meer dan 85%. Dit biedt een effectieve en gemakkelijk te populariseren technische manier voor grootschalige vroege screening van visuele functiestoornissen en gerelateerde oogaandoeningen bij zuigelingen.

Eind 2014 rapporteerde Nature Medicine een onderzoek van meer dan 10 medische en onderzoeksinstellingen wereldwijd, waaronder het Shanghai Institute of Pancreatic Disease en het First Affiliated Hospital van de Universiteit van Zhejiang. De auteur paste AI toe op de screening van alvleesklierkanker bij asymptomatische personen in centra voor lichamelijk onderzoek, ziekenhuizen, enz., om laesiekenmerken op CT-scans te detecteren die moeilijk met het blote oog te zien zijn. Dit leidde tot een efficiënte en niet-invasieve vroege detectie van alvleesklierkanker. Bij het analyseren van gegevens van meer dan 20.000 patiënten identificeerde het model ook 31 gevallen van klinisch gemiste laesies, wat de klinische resultaten aanzienlijk verbeterde.

Delen van medische gegevens

In 2023 zijn er wereldwijd nog veel meer perfecte mechanismen voor het delen van gegevens en succesvolle voorbeelden ontstaan, die zorgen voor samenwerking tussen verschillende centra en openheid van gegevens, onder het uitgangspunt van de bescherming van de privacy en beveiliging van gegevens.

Ten eerste hebben AI-onderzoekers met behulp van AI-technologie zelf bijgedragen aan het delen van medische gegevens. Qi Chang en anderen van Rutgers University in de Verenigde Staten publiceerden een artikel in Nature Communications waarin ze een federaal leerkader (DSL) voorstelden, gebaseerd op gedistribueerde synthetische adversarial networks. Dit kader gebruikt generatieve AI om de specifiek gegenereerde data van multicenters te trainen en vervangt vervolgens de echte data van multicenters door de gegenereerde data. Zorg voor AI-training op basis van multicenter big data en bescherm tegelijkertijd de privacy van de data. Hetzelfde team maakt ook een dataset open source met gegenereerde pathologische beelden en bijbehorende annotaties. Het segmentatiemodel dat is getraind op de gegenereerde dataset kan vergelijkbare resultaten opleveren als de echte data.

Het team van Dai Qionghai van de Tsinghua Universiteit publiceerde een artikel over npj Digital Health, waarin Relay Learning werd voorgesteld. Dit systeem gebruikt big data van meerdere locaties om AI-modellen te trainen, uitgaande van lokale datasoevereiniteit en zonder netwerkverbindingen tussen locaties. Het combineert databeveiliging en privacy met het streven naar AI-prestaties. Hetzelfde team ontwikkelde en valideerde vervolgens gezamenlijk CAIMEN, een diagnosesysteem voor pan-mediastinale tumoren met CT-scans van de borstkas, gebaseerd op federale kennis, in samenwerking met het First Affiliated Hospital van de Guangzhou Medical University en 24 ziekenhuizen in het hele land. Het systeem, dat kan worden toegepast op 12 veelvoorkomende mediastinale tumoren, behaalde een 44,9 procent hogere nauwkeurigheid bij gebruik op zichzelf dan bij gebruik door menselijke experts alleen, en een 19 procent hogere diagnosenauwkeurigheid wanneer menselijke experts erdoor werden ondersteund.

Aan de andere kant zijn er verschillende initiatieven gaande om veilige, wereldwijde en grootschalige medische datasets te bouwen. In november 2023 publiceerden Agustina Saenz en anderen van de afdeling Biomedische Informatica van Harvard Medical School online in Lancet Digital Health een wereldwijd raamwerk voor het delen van medische beeldgegevens, genaamd Artificial Intelligence Data for All Healthcare (MAIDA). Ze werken samen met zorginstellingen over de hele wereld om uitgebreide richtlijnen te bieden voor het verzamelen en anonimiseren van gegevens, waarbij ze gebruikmaken van het sjabloon van de Amerikaanse Federal Demonstration Partner (FDP) om het delen van gegevens te standaardiseren. Ze zijn van plan om geleidelijk datasets vrij te geven die in verschillende regio's en klinische settings over de hele wereld zijn verzameld. De eerste dataset zal naar verwachting begin 2024 worden vrijgegeven, en er zullen er meer volgen naarmate de samenwerking zich uitbreidt. Het project is een belangrijke poging om een ​​wereldwijde, grootschalige en diverse set openbaar beschikbare AI-data op te bouwen.

Naar aanleiding van het voorstel heeft de UK Biobank het goede voorbeeld gegeven. De UK Biobank publiceerde op 30 november nieuwe gegevens uit de volledige genoomsequentie van haar 500.000 deelnemers. De database, die de volledige genoomsequentie van elk van de 500.000 Britse vrijwilligers publiceert, is de grootste complete database met het menselijk genoom ter wereld. Onderzoekers over de hele wereld kunnen toegang tot deze geanonimiseerde gegevens aanvragen en deze gebruiken om de genetische basis van gezondheid en ziekte te onderzoeken. Genetische gegevens waren in het verleden altijd zeer gevoelig voor verificatie, en deze historische prestatie van de UK Biobank bewijst dat het mogelijk is om een ​​open, privacyvrije, wereldwijde, grootschalige database op te bouwen. Met deze technologie en database zal medische AI ​​ongetwijfeld een volgende stap zetten.

Verificatie en evaluatie van medische AI

Vergeleken met de snelle ontwikkeling van medische AI-technologie zelf, verloopt de ontwikkeling van verificatie en evaluatie van medische AI ​​iets trager. Validatie en evaluatie op het gebied van AI in het algemeen negeren vaak de werkelijke behoeften van clinici en patiënten aan AI. Traditionele gerandomiseerde gecontroleerde klinische studies zijn te arbeidsintensief om de snelle ontwikkeling van AI-tools te evenaren. Het zo snel mogelijk verbeteren van het verificatie- en evaluatiesysteem dat geschikt is voor medische AI-tools is de belangrijkste stap om medische AI ​​te bevorderen en zo een sprong voorwaarts te maken van onderzoek en ontwikkeling naar klinische implementatie.

In Googles onderzoekspaper over Med-PaLM, gepubliceerd in Nature, publiceerde het team ook de MultiMedQA-evaluatiebenchmark, die wordt gebruikt om het vermogen van grote taalmodellen om klinische kennis te verwerven te beoordelen. De benchmark combineert zes bestaande datasets met professionele medische vragen en antwoorden, die professionele medische kennis, onderzoek en andere aspecten behandelen, evenals een dataset met een online database met medische vragen en antwoorden, die online vragen en antwoorden tussen artsen en patiënten behandelt en AI vanuit vele aspecten probeert te trainen tot een gekwalificeerde arts. Daarnaast stelt het team een ​​raamwerk voor, gebaseerd op menselijke beoordeling, dat rekening houdt met meerdere dimensies van feiten, begrip, redenering en mogelijke vooringenomenheid. Dit is een van de meest representatieve onderzoeksinspanningen ter evaluatie van AI in de gezondheidszorg die dit jaar is gepubliceerd.

Betekent het feit dat grote taalmodellen een hoog niveau van klinische kennis in codering laten zien, echter ook dat grote taalmodellen geschikt zijn voor klinische taken in de praktijk? Net zoals een geneeskundestudent die met een perfecte score slaagt voor het beroepsexamen arts nog lang geen solo-hoofdarts is, zijn de door Google voorgestelde evaluatiecriteria mogelijk geen perfect antwoord op het onderwerp van medische AI-evaluatie voor AI-modellen. Al in 2021 en 2022 hebben onderzoekers rapportagerichtlijnen voorgesteld zoals Decid-AI, SPIRIT-AI en INTRPRT, in de hoop de vroege ontwikkeling en validatie van medische AI ​​te begeleiden, rekening houdend met factoren zoals klinische bruikbaarheid, veiligheid, menselijke factoren en transparantie/interpreteerbaarheid. Onlangs publiceerde het tijdschrift Nature Medicine een studie van onderzoekers van Oxford University en Stanford University over de vraag of "externe validatie" of "terugkerende lokale validatie" moet worden gebruikt om AI-tools te valideren.

De onbevooroordeeldheid van AI-tools is ook een belangrijke evaluatierichting die dit jaar aandacht heeft gekregen in zowel Science- als NEJM-artikelen. AI vertoont vaak vooringenomenheid omdat het beperkt is tot trainingsdata. Deze vooringenomenheid kan een weerspiegeling zijn van sociale ongelijkheid, die zich vervolgens ontwikkelt tot algoritmische discriminatie. De National Institutes of Health lanceerden onlangs het Bridge2AI-initiatief, met een geschatte kostprijs van $ 130 miljoen, om diverse datasets te bouwen (in lijn met de doelen van het bovengenoemde MAIDA-initiatief) die kunnen worden gebruikt om de onbevooroordeeldheid van medische AI-tools te valideren. Deze aspecten worden niet meegenomen door MultiMedQA. De vraag hoe medische AI-modellen gemeten en gevalideerd kunnen worden, behoeft nog uitgebreide en diepgaande discussie.

In januari publiceerde Nature Medicine een opiniestuk getiteld "The Next Generation of Evidence-Based Medicine" van Vivek Subbiah van het MD Anderson Cancer Center van de Universiteit van Texas. Hierin werden de beperkingen van klinische studies, die aan het licht kwamen in de context van de COVID-19-pandemie, besproken en werd de tegenstrijdigheid tussen innovatie en naleving van het klinische onderzoeksproces benadrukt. Ten slotte werd gewezen op een toekomst waarin klinische studies worden herstructureerd – de volgende generatie klinische studies met behulp van kunstmatige intelligentie, dat wil zeggen het gebruik van kunstmatige intelligentie op basis van een groot aantal historische onderzoeksgegevens, gegevens uit de praktijk, multimodale klinische gegevens en gegevens van draagbare apparaten om cruciaal bewijs te vinden. Betekent dit dat AI-technologie en klinische AI-validatieprocessen elkaar in de toekomst mogelijk versterken en samen evolueren? Dit is de open en tot nadenken stemmende vraag van 2023.

Regulering van medische AI

De vooruitgang van AI-technologie brengt ook uitdagingen met zich mee voor de regulering van AI, en beleidsmakers wereldwijd reageren hier zorgvuldig op. In 2019 publiceerde de FDA voor het eerst een voorstel voor een regelgevingskader voor softwarewijzigingen in medische hulpmiddelen met kunstmatige intelligentie (discussieontwerp), waarin de mogelijke aanpak voor premarket review van AI en op machine learning gebaseerde softwarewijzigingen werd beschreven. In 2021 stelde de FDA het "Artificial Intelligence/Machine Learning-based Software as a Medical Device Action Plan" voor, waarin vijf specifieke medische AI-regelgevingsmaatregelen werden verduidelijkt. Dit jaar publiceerde de FDA de Premarket Submission for Device Software Features opnieuw om informatie te verstrekken over aanbevelingen voor premarket submissions voor de evaluatie door de FDA van de veiligheid en werkzaamheid van softwarefuncties van hulpmiddelen, waaronder enkele softwarefuncties die gebruikmaken van machine learning-modellen die zijn getraind met behulp van machine learning-methoden. Het regelgevingsbeleid van de FDA is geëvolueerd van een eerste voorstel tot praktische richtlijnen.

Na de publicatie van de European Health Data Space in juli vorig jaar heeft de EU opnieuw de Artificial Intelligence Act aangenomen. De eerste wet beoogt gezondheidsgegevens optimaal te benutten om hoogwaardige gezondheidszorg te bieden, ongelijkheden te verminderen en gegevens te ondersteunen voor preventie, diagnose, behandeling, wetenschappelijke innovatie, besluitvorming en wetgeving, en tegelijkertijd te waarborgen dat EU-burgers meer controle hebben over hun persoonlijke gezondheidsgegevens. De tweede wet maakt duidelijk dat het medische diagnosesysteem een ​​AI-systeem met een hoog risico is en dat het gericht streng toezicht, toezicht gedurende de hele levenscyclus en toezicht vóór evaluatie nodig heeft. Het Europees Geneesmiddelenbureau (EMA) heeft een conceptdiscussienota gepubliceerd over het gebruik van AI ter ondersteuning van de ontwikkeling, regulering en het gebruik van geneesmiddelen, met de nadruk op het verbeteren van de geloofwaardigheid van AI om de veiligheid van patiënten en de integriteit van klinische onderzoeksresultaten te waarborgen. Over het algemeen krijgt de regelgevingsaanpak van de EU geleidelijk vorm en de definitieve implementatiedetails kunnen gedetailleerder en strenger zijn. In schril contrast met de strenge regelgeving van de EU, blijkt uit het Britse AI-reguleringsplan dat de overheid een zachte aanpak wil hanteren en voorlopig geen nieuwe wetten zal aannemen of nieuwe toezichthouders zal oprichten.

In China heeft het Medical Device Technical Review Center (NMPA) van de National Medical Products Administration eerder documenten uitgegeven zoals "Review Points of Deep Learning Assisted Decision Software", "Guiding Principles for the Registration Review of Artificial Intelligence Medical Devices (Draft for Comment)" en "Circular on Guiding Principles for the Classification and Definition of Artificial Intelligence Medical Software Products (No. 47 in 2021)". Dit jaar werd opnieuw de "Samenvatting van de eerste classificatieresultaten voor medische hulpmiddelen in 2023" gepubliceerd. Deze reeks documenten maakt de definitie, classificatie en regulering van medische softwareproducten met kunstmatige intelligentie (AI) duidelijker en gebruiksvriendelijker, en biedt duidelijke richtlijnen voor de positionerings- en registratiestrategieën van verschillende bedrijven in de sector. Deze documenten bieden een kader en managementbeslissingen voor de wetenschappelijke regulering van medische AI-hulpmiddelen. Het is de moeite waard om uit te kijken naar de agenda van de China Medical Artificial Intelligence Conference, die van 21 tot en met 23 december in Hangzhou werd gehouden, met een speciaal forum over digitaal medisch bestuur en hoogwaardige ontwikkeling van openbare ziekenhuizen en een forum voor de ontwikkeling van de industrie voor de standaardisatie van technologie voor het testen en evalueren van medische hulpmiddelen met kunstmatige intelligentie. Ambtenaren van de Nationale Commissie voor Ontwikkeling en Hervorming en de NMPA zullen de vergadering bijwonen en mogelijk nieuwe informatie vrijgeven.

Conclusie

In 2023 begint medische AI ​​te integreren in het gehele medische upstream- en downstreamproces, inclusief dataverzameling, fusie, analyse, diagnose en behandeling in ziekenhuizen, en screening in de gemeenschap. Daarnaast werkt AI organisch samen met medisch/ziektebestrijdingspersoneel, wat de potentie aantoont om welzijn te bevorderen in de menselijke gezondheid. Bruikbaar onderzoek naar medische AI ​​begint vorm te krijgen. In de toekomst hangt de vooruitgang van medische AI ​​niet alleen af ​​van de technologische ontwikkeling zelf, maar is ook de volledige medewerking van de industrie, universiteiten en medisch onderzoek, en de steun van beleidsmakers en regelgevers, vereist. Deze domeinoverschrijdende samenwerking is de sleutel tot het bereiken van AI-geïntegreerde medische diensten en zal de ontwikkeling van de menselijke gezondheid zeker bevorderen.


Plaatsingstijd: 30-12-2023