Earlydoc in test van Harvard University
De diagnostische en triage nauwkeurigheid bepalen van online symptoomcheckers (tools die computeralgoritmen gebruiken om patiënten met zelfdiagnose of zelftriage te helpen).
Evaluatie van symptoomcheckers voor zelfdiagnose en triage: auditonderzoek
Abstract
Doelstelling: De diagnostische en triage nauwkeurigheid bepalen van online symptoomcheckers (tools die computeralgoritmen gebruiken om patiënten met zelfdiagnose of zelftriage te helpen).
Ontwerp: auditonderzoek.
Instelling: openbaar beschikbare, gratis symptoomcheckers.
Deelnemers: 23 symptoomcheckers die in het Engels waren en advies gaven over een reeks aandoeningen. Er werden 45 gestandaardiseerde patiëntvignetten samengesteld en gelijkelijk verdeeld in drie categorieën van triage-urgentie: opkomende zorg vereist (bijvoorbeeld longembolie), niet-opkomende zorg redelijk (bijvoorbeeld otitis media) en redelijke zelfzorg (bijvoorbeeld virale bovenliggende luchtweginfectie).
Belangrijkste uitkomstmaten: Voor symptoomcheckers die een diagnose leverden, waren onze belangrijkste uitkomsten of de symptoomchecker eerst de juiste diagnose vermeldde of binnen de eerste 20 mogelijke diagnoses (n = 770 gestandaardiseerde patiëntevaluaties). Voor symptoomcheckers die een triage-aanbeveling opleverden, waren onze belangrijkste uitkomsten of de symptoomchecker op de juiste manier spoedeisende zorg, niet-spoedeisende zorg of zelfzorg aanbeveelde (n = 532 gestandaardiseerde patiëntevaluaties).
Resultaten: De 23 symptoomcheckers gaven als eerste de juiste diagnose in 34% (95% betrouwbaarheidsinterval 31% tot 37%) van de gestandaardiseerde patiëntevaluaties, waarbij de juiste diagnose werd vermeld in de top 20 van diagnoses bij 58% (55% tot 62%) van gestandaardiseerde patiëntevaluaties en gaf het juiste triage-advies in 57% (52% tot 61%) van gestandaardiseerde patiëntevaluaties. Triageprestaties varieerden afhankelijk van de urgentie van de aandoening, met passend triageadvies in 80% (95% betrouwbaarheidsinterval 75% tot 86%) van de opkomende gevallen, 55% (47% tot 63%) van de niet-opkomende gevallen en 33% ( 26% tot 40%) van de gevallen van zelfzorg (P <0,001). Prestaties op het juiste triage-advies over de 23 individuele symptoomcheckers varieerden van 33% (95% betrouwbaarheidsinterval 19% tot 48%) tot 78% (64% tot 91%) van gestandaardiseerde patiëntevaluaties.
Conclusies: Symptoomcontroleurs hadden tekortkomingen in zowel triage als diagnose. Triage-advies van symptoomcheckers is over het algemeen risicomijdend en moedigt gebruikers aan om zorg te zoeken voor omstandigheden waarin zelfzorg redelijk is.
Andere bronnen
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4496786/
Invoering
Burgers maken steeds vaker gebruik van internet om hun gezondheidsproblemen te onderzoeken. Het online patiëntenportaal van het Verenigd Koninkrijk voor nationale gezondheidsinformatie, NHS Choices, meldt bijvoorbeeld meer dan 15 miljoen bezoeken per maand.1 Meer dan een derde van de volwassenen in de Verenigde Staten gebruikt het internet regelmatig om zelf een diagnose van hun aandoeningen te stellen. niet-urgente symptomen en voor urgente symptomen zoals pijn op de borst.2 3 Hoewel er een schat aan online bronnen is om meer te weten te komen over specifieke aandoeningen, begint zelfdiagnose meestal met zoekmachines zoals Google, Bing of Yahoo.2 Maar internetzoekmachines kan gebruikers naar verwarrende en soms ongefundeerde informatie leiden, en mensen met urgente symptomen worden mogelijk niet doorverwezen naar spoedeisende zorg.3-6 De laatste tijd is er een wildgroei van meer geavanceerde programma’s, symptoomcheckers genaamd, die proberen om effectiever een mogelijke diagnose te stellen voor patiënten en verwijzen naar de juiste zorginstelling.3 6-13 Met behulp van geautomatiseerde algoritmen stellen symptoomcheckers gebruikers een reeks vragen over hun ymptoms of vereisen dat gebruikers zelf details over hun symptomen invoeren. De algoritmen variëren en kunnen vertakkingslogica, bayesiaanse inferentie of andere methoden gebruiken. Particuliere bedrijven en andere organisaties, waaronder de National Health Service, de American Academy of Pediatrics en de Mayo Clinic, hebben hun eigen symptoomcheckers gelanceerd. Een symptoomchecker, iTriage, meldt 50 miljoen keer per jaar.14 Symptoomcheckers zijn doorgaans toegankelijk via websites, maar sommige zijn ook beschikbaar als apps voor smartphones of tablets. Symptoomcontroles hebben twee hoofdfuncties: om zelfdiagnose te vergemakkelijken en om te helpen bij triage. De zelfdiagnosefunctie biedt een lijst met diagnoses, meestal gerangschikt op waarschijnlijkheid. De diagnosefunctie is doorgaans bedoeld om patiënten voor te lichten over de reeks diagnoses die mogelijk bij hun symptomen passen. De triage-functie informeert patiënten of ze überhaupt zorg moeten zoeken en, zo ja, waar (dat wil zeggen spoedeisende hulp, huisartsenpraktijk) en met welke urgentie (dat wil zeggen spoed of binnen enkele dagen). Symptoomcheckers kunnen triage-telefoonlijnen aanvullen of vervangen, die gebruikelijk zijn in de eerstelijnszorg.15-18 Om de veiligheid van medische mobiele apps te waarborgen, overweegt het Amerikaanse Congres de regulering van apps die ‘een lijst van mogelijke medische aandoeningen en advies over wanneer u een zorgverlener moet raadplegen. ”19 20 Symptoomcontroleurs hebben verschillende potentiële voordelen. Ze kunnen patiënten met een levensbedreigend probleem, zoals een beroerte of een hartaanval, aanmoedigen om spoedeisende zorg te zoeken.21 Voor patiënten met een niet-opkomend probleem waarvoor geen medisch bezoek nodig is, kunnen deze programma’s mensen geruststellen en aanbevelen dat ze thuis blijven. Voor ongeveer een kwart van de bezoeken voor acute luchtwegaandoeningen, zoals virale infectie van de bovenste luchtwegen, krijgen patiënten geen andere interventie dan vrij verkrijgbare behandeling, 22 en meer dan de helft van de patiënten krijgt onnodige antibiotica.23-25 Het verminderen van het aantal bezoeken bespaart patiënten ‘tijd en geld, schrikt het te veel voorschrijven van antibiotica af en kan de vraag naar eerstelijnszorgverleners doen afnemen – een kritiek probleem gezien het feit dat de werkdruk voor huisartsen in het Verenigd Koninkrijk tussen 1995 en 2008 met 62% is gestegen.17 Er zijn echter een aantal belangrijke zorgen. Als patiënten met een levensbedreigend probleem een verkeerde diagnose krijgen en niet wordt verteld dat ze zorg moeten zoeken, kan hun gezondheid verslechteren, waardoor de morbiditeit en mortaliteit toenemen. Als aan patiënten met een lichte ziekte wordt verteld dat ze zorg moeten zoeken, in het bijzonder op een afdeling spoedeisende hulp, kunnen dergelijke programma’s het aantal bezoeken onnodig verhogen en daardoor resulteren in meer tijd en kosten voor patiënten en de samenleving. De impact van symptoomcheckers zal in grote mate afhangen van hun klinische prestaties. Om de nauwkeurigheid van diagnose en triage-advies van symptoomcheckers te meten, hebben we 45 gestandaardiseerde patiëntvignetten gebruikt om 23 symptoomcheckers te auditen. De vignetten weerspiegelden een reeks aandoeningen, van algemeen tot minder vaak en van lage scherpte tot levensbedreigend.
Methoden
Zoekstrategie voor symptoomcheckers Tussen juni 2014 en november 2014 hebben we gezocht naar symptoomcheckers die in het Engels waren, gratis waren, openbaar beschikbaar waren, voor mensen waren (in vergelijking met diergeneeskundig gebruik) en niet gericht waren op één type aandoening (voor bijvoorbeeld alleen orthopedische problemen). Om symptoomcheckers te vinden die beschikbaar waren als apps in de Apple App Store en Google Play, gebruikten we twee zoektermen (‘symptoomchecker’, ‘medische diagnose’) die werden gebruikt in een recent onderzoek naar symptoomcheckers en onderzochten we de eerste 240 zoekresultaten door hand.12 We kozen voor 240 omdat deze cut-off is gebruikt in eerdere onderzoeken waarin naar app-winkels voor smartphones is gezocht.26 Om online symptoomcheckers te vinden, hebben we dezelfde twee zoektermen in Google en Google Scholar ingevoerd en de eerste 300 resultaten onderzocht. In eerder onderzoek is de kans op relevante zoekresultaten die met Google zijn geïdentificeerd aanzienlijk afgenomen na de eerste 300 resultaten. 27 We vulden onze zoekopdrachten aan door de ontwikkelaars van twee symptoomcheckers te vragen of ze andere concurrerende producten kenden.
In totaal hebben we 143 symptoomcheckers geïdentificeerd. We hebben er 102 uitgesloten die dezelfde medische inhoud en logica gebruikten als een ander instrument (en dus identiek zouden presteren) (zie lijst in aanvullende bijlage). We hebben nog eens 25 uitgesloten die zich alleen richtten op een enkele ziekteklasse (bijvoorbeeld orthopedische problemen), 14 die alleen medisch advies gaven (bijvoorbeeld welke symptomen typisch geassocieerd zijn met een bepaalde aandoening) en geen diagnose of triage-advies gaven , en twee die niet werkten. Na deze uitsluitingen hebben we 23 symptoomcheckers geëvalueerd.
Kenmerken van symptoomcontroleurs
We hebben symptoomcheckers gecategoriseerd op basis van of ze zelfdiagnose, zelftriage of beide mogelijk maakten; type organisatie dat de symptoomchecker uitvoerde; en het maximale aantal verstrekte diagnoses en of ze waren gebaseerd op Schmitt- of Thompson-richtlijnen voor verpleegkundige triage, die beslissingsondersteunende protocollen zijn die vaak worden gebruikt bij telefonische triage voor respectievelijk pediatrische en volwassen consulten. een financiële prikkel hebben om onnodige bezoeken af te schrikken. In de aanvullende bijlage geven we, indien beschikbaar, gegevens over het geschatte totale aantal bezoekers om symptoomcheckers te selecteren.
Klinische vignetten
Om de diagnose en triageprestaties van de symptoomcheckers te evalueren, hebben we 45 gestandaardiseerde patiëntenvignetten gebruikt. We hebben klinische vignetten gebruikt om prestaties te beoordelen, omdat ze een veelgebruikte methode zijn om artsen en andere clinici te testen op hun diagnostisch vermogen en managementbeslissingen. We hebben doelbewust gestandaardiseerde patiëntenvignetten geselecteerd uit drie categorieën van triage-urgentie: 15 vignetten waarvoor spoedzorg vereist is, 15 vignetten waarvoor niet-spoedeisende zorg redelijk is, en 15 vignetten waarvoor een medisch bezoek over het algemeen niet nodig is en zelfzorg voldoende is. We kozen vignetten voor het hele spectrum van ernst omdat patiënten symptoomcheckers gebruiken voor symptomen die zowel spoedeisende als niet-spoedeisende zorg vereisen.3 We hebben vignetten opgenomen voor zowel veel voorkomende als ongewone aandoeningen, omdat we geloven dat de klinische gemeenschap vooral geïnteresseerd zou zijn in prestaties voor minder vaak voorkomende aandoeningen. maar potentieel levensbedreigende problemen. De gestandaardiseerde patiëntenvignetten werden geïdentificeerd uit verschillende klinische bronnen, waaronder materiaal dat werd gebruikt om gezondheidswerkers op te leiden en een website met medische bronnen met inhoud die werd verstrekt door een panel van artsen.30 De bron voor elk vignet bevatte ook de bijbehorende juiste diagnose. Bij symptoomcontroles moeten gebruikers over het algemeen een lijst met symptomen invoeren of een reeks vragen stellen over hun symptomen. Elk vignet werd vereenvoudigd tot een kernset van symptomen voor gemakkelijke invoer, en in sommige situaties hebben we de gegevens van het vignet aangevuld omdat een symptoomchecker vroeg naar een symptoom dat niet in het vignet werd behandeld (zie de aanvullende bijlage voor details over de bron, kern symptomen en aanvullende symptomen voor elk vignet).
We hebben de 45 vignetten gecategoriseerd als ‘gewone’ of ‘ongebruikelijke’ diagnoses op basis van de prevalentie van de diagnose onder ambulante bezoeken in de Verenigde Staten (voor volledige details zie de aanvullende bijlage) .31
Beoordeling van diagnose en triage-resultaten
Elk gestandaardiseerd patiëntenvignet werd in elke website of app ingevoerd en we legden de resulterende diagnoses en triage-adviezen vast. Een auteur (HS) zonder klinische opleiding heeft alle vignetten ingevoerd. Een willekeurige steekproef van 25 vignetten werd ingevoerd in symptoomcheckers door een andere persoon zonder klinische training en de interbeoordelaarsbetrouwbaarheid tussen de twee bij het vastleggen van de aanbevelingen van de symptoomchecker voor diagnose en triage was hoog (Cohen’s κ 0,90). In sommige gevallen konden we een vignet niet beoordelen omdat sommige symptoomcheckers zich alleen op kinderen of volwassenen richten, of omdat de symptoomchecker het belangrijkste symptoom in het vignet niet opsomde of vroeg. Om deze symptoomcheckers niet te bestraffen, noemden we gestandaardiseerde patiëntvignetten die met succes een output opleverden ‘gestandaardiseerde patiëntevaluaties’. Om de diagnostische nauwkeurigheid te beoordelen, hebben we gekeken of de juiste diagnose als eerste werd vermeld of helemaal niet. Voor verschillende vignetten presenteerden twee symptoomcheckers een groot aantal diagnoses (maar liefst 99). Omdat het onwaarschijnlijk is dat een dergelijke lange lijst van mogelijke diagnoses nuttig is voor patiënten, beschouwden we een diagnose alleen als vermeld als deze binnen de eerste 20 diagnoses viel die door een symptoomchecker werden gesteld. Het is mogelijk dat veel patiënten zich alleen richten op de genoemde topdiagnoses. Daarom hebben we ook gekeken of bij de eerste drie gegeven diagnoses de juiste diagnose stond. We oordeelden dat de diagnose onjuist was als de symptoomchecker aangaf dat de aandoening niet kon worden vastgesteld. We hebben het triage-advies in drie groepen onderverdeeld: urgent, inclusief advies om een ambulance te bellen, naar de spoedeisende hulp te gaan of onmiddellijk een huisarts te raadplegen; niet-opkomend, inclusief advies om een huisarts of eerstelijns zorgverlener te bellen, een huisarts of eerstelijns zorgverlener te bezoeken, naar een spoedeisende zorginstelling te gaan, naar een specialist te gaan, naar een winkelkliniek te gaan of een e-bezoek te hebben ; en zelfzorg, inclusief advies om thuis te blijven of naar een apotheek te gaan. Als er meerdere triage-locaties werden voorgesteld (bijvoorbeeld spoedeisende hulp of specialist), hebben we de meest urgente suggestie gebruikt. We kozen hiervoor omdat in bijna alle gevallen de meest urgente suggestie voor triage als eerste werd vermeld. Als een symptoomchecker voor een bepaald gestandaardiseerd patiëntenvignet geen beslissing kon nemen over de diagnose, maar wel triage-advies gaf, hebben we alsnog de geschiktheid van dit triage-advies beoordeeld. Symptoomcheckers waarbij gebruikers de juiste diagnose moesten selecteren voordat ze triage-advies gaven, werden niet meegenomen bij de beoordeling van de nauwkeurigheid van triage, met uitzondering van iTriage, dat altijd opkomend triage-advies voorstelde.
Betrokkenheid van de patiënt
Er was geen betrokkenheid van de patiënt bij deze studie
Analyse
We berekenden samenvattende statistieken voor diagnostische nauwkeurigheid en triage-advies met 95% betrouwbaarheidsintervallen op basis van binominale verdeling met Stata / MP 13.0. Gezien onze focus op symptoomcheckers als geheel, hebben we geen statistische nauwkeurigheidsvergelijkingen gemaakt tussen individuele symptoomcheckers. We gebruikten χ2 tests om de diagnose en triage-nauwkeurigheid te vergelijken op niveau en urgentie en op type symptoomchecker. We hebben een gevoeligheidsanalyse uitgevoerd van triage-advies, waarbij we verschillende symptoomcheckers hebben uitgesloten die altijd of meestal spoedeisende zorg aanbevelen.
Resultaten
Onderzoeksmonster De 23 geïdentificeerde symptoomcheckers waren gevestigd in het Verenigd Koninkrijk, de Verenigde Staten, Nederland en Polen (tabel 1): 11 symptoomcheckers gaven zowel diagnoses als triage-advies, acht gaven alleen diagnoses en vier gaven alleen triage-advies. De 45 gestandaardiseerde patiëntvignetten bevatten 26 veelvoorkomende en 19 ongebruikelijke diagnoses. De prestaties werden beoordeeld op in totaal 770 gestandaardiseerde patiëntevaluaties voor diagnose en 532 gestandaardiseerde patiëntevaluaties voor triage. Bij de symptoomcheckers vroegen er 10 niet om demografische gegevens (leeftijd en geslacht).
Nauwkeurigheid van diagnose
Over het algemeen werd de juiste diagnose als eerste vermeld in 34% (95% betrouwbaarheidsinterval 31% tot 37%; tabel 2) van gestandaardiseerde patiëntevaluaties. Prestaties varieerden door urgentie van de conditie. De juiste diagnose werd als eerste vermeld voor 24% (19% tot 30%) van de opkomende gestandaardiseerde patiëntevaluaties, 38% (32% tot 34%) van de niet-opkomende gestandaardiseerde patiëntevaluaties en 40% (34% tot 47%) van de zelfzorg gestandaardiseerde patiëntevaluaties (P <0,001 ter vergelijking, tabel 2). Er was geen verschil tussen symptoomcheckers die wel en niet om demografische informatie vroegen (34%, 95% betrouwbaarheidsinterval 30% tot 39% en 34%, 28% tot 39%, P = 0,88; tabel 3). De juiste diagnose werd echter vaker als eerste vermeld in gestandaardiseerde patiëntevaluaties voor veelvoorkomende diagnoses dan voor ongebruikelijke diagnoses (38%, 34% tot 43% en 28%, 23% tot 33%, P = 0,004; tabel 2). De prestaties varieerden per symptoomchecker. De correcte diagnose als eerste opsommen in gestandaardiseerde patiëntevaluaties varieerde van 5% voor MEDoctor (95% betrouwbaarheidsinterval 0% tot 13%) tot 50% voor DocResponse (33% tot 67%; tabel 4). Er werden weinig verschillen waargenomen in de kenmerken van de symptoomcheckers (tabel 3). Bij alle symptoomcontroleurs werd de juiste diagnose vermeld in de eerste drie diagnoses in 51% (95% betrouwbaarheidsinterval 47% tot 54%) van gestandaardiseerde patiëntevaluaties en in de eerste 20 diagnoses bij 58% (55% tot 62%) van gestandaardiseerde patiëntevaluaties (tabel 2). Diagnostische nauwkeurigheid voor het vermelden van de juiste diagnose in de top drie en top 20 was hoger voor zelfzorgcondities dan voor opkomende aandoeningen en was ook hoger voor veelvoorkomende aandoeningen dan voor ongebruikelijke aandoeningen. Er was geen significant verschil in het vermelden van de juiste diagnose in de top 20 tussen symptoomcheckers die meer dan 11 diagnoses vermeldden in vergelijking met degenen die slechts 1-3 diagnoses vermeldden (59%, 53% tot 65% versus 53%, 46% tot 59 %, P = 0,12; tabel 3). De nauwkeurigheid van het opsommen van de juiste diagnose in de top 20 van de 23 individuele symptoomcontroleurs varieerde van 34% (95% betrouwbaarheidsinterval 17% tot 52%) tot 84% (73% tot 95%, tabel 4).
Nauwkeurigheid van triage-advies
Passend triage-advies werd gegeven in 57% (95% betrouwbaarheidsinterval 52% tot 61%) van gestandaardiseerde patiëntevaluaties (tabel 2). Prestaties op triage-advies waren hoger voor gestandaardiseerde patiëntevaluaties tijdens urgente zorg dan voor niet-opkomende en zelfzorg gestandaardiseerde patiëntevaluaties: 80% (75% tot 86%) v 55% (47% tot 63%) v 33% (26% tot 40%), P <0,001). Passend triage-advies was hoger voor zeldzame diagnoses dan voor veel voorkomende diagnoses: 63% (57% tot 70%) versus 52% (46% tot 57%), P = 0,01). iTriage, Symcat, Symptomate en Isabel stelden gebruikers altijd voor om zorg te zoeken en adviseerden daarom nooit zelfzorg (tabel 4). Na uitsluiting van deze vier symptoomcheckers, werd passend triage-advies gegeven in 61% (95% betrouwbaarheidsinterval 56% tot 66%) van gestandaardiseerde patiëntevaluaties (zie aanvullende tabel 5). Symptoomcontroleurs die de Schmitt- of Thompson-verpleegkundige triageprotocollen gebruikten, gaven meer kans om geschikte triagebeslissingen te nemen dan degenen die dat niet deden: 72% (95% betrouwbaarheidsinterval 60% tot 84%) v 55% (50% tot 59%), P = 0,01; tabel 3. Nauwkeurig triage-advies varieerde per exploitant van symptoomchecker (groepen van zorgverleners en artsenverenigingen 68% (58% tot 77%), particuliere bedrijven 59% (53% tot 65%), gezondheidsplannen of overheden 43% (34% tot 51%), P <0,001).
Discussie
Met behulp van gestandaardiseerde patiëntvignetten hebben we de diagnostische en triage nauwkeurigheid van symptoomcheckers gemeten. Hoewel er een scala aan prestaties was bij de symptoomcontroleurs, hadden ze over het algemeen tekortkomingen in zowel de diagnose als de nauwkeurigheid van de triage. Gemiddeld gaven symptoomcheckers de juiste diagnose binnen de eerste 20 vermeld in 58% van de gestandaardiseerde patiëntevaluaties, waarbij de best presterende symptoomchecker de juiste diagnose vermeldde in 84% van de gestandaardiseerde patiëntevaluaties. Symptoomcontroleurs adviseerden ongeveer de helft van de tijd het juiste zorgniveau, maar dit varieerde naargelang de klinische ernst. De juiste triage-beslissing was veel hoger voor gestandaardiseerde patiëntevaluaties die spoedeisende zorg vereisen (80%) dan voor degenen waarvoor zelfzorg geschikt was (34%).
Vergelijkingen met andere onderzoeken
Onze resultaten op het gebied van diagnostische nauwkeurigheid en geschikte triage zijn ongeveer gelijk aan eerder onderzoek naar de uitvoering van enkelvoudige symptoomcheckers voor een beperkte reeks diagnoses.6-8 32 Een orthopedische symptoomchecker somde 89% van de tijd de juiste diagnose voor kniepijn op, en Boots WebMD somde 70% van de tijd de juiste diagnose op voor symptomen van oor, neus en keel.7 8 Een studie die ook twee algemene acute gestandaardiseerde patiëntenvignetten gebruikte om WebMD te evalueren, rapporteerde een diagnostische nauwkeurigheid van 50%. 6 Of dit prestatieniveau voor diagnose en triage dat we hebben waargenomen acceptabel is, hangt af van de vergelijkingsnorm. Als symptoomcheckers worden gezien als vervanging voor het bezoeken van een arts, zijn ze waarschijnlijk een inferieur alternatief. Aangenomen wordt dat artsen een diagnostische nauwkeurigheid hebben van 85-90%, hoewel in sommige onderzoeken met klinische vignetten de prestatie lager was.33 34 Persoonlijke doktersbezoeken kunnen echter de verkeerde vergelijking zijn, omdat patiënten waarschijnlijk geen symptoomcheckers gebruiken om een definitieve diagnose te krijgen, maar voor snelle en toegankelijke begeleiding. Ook kan in plaats van diagnostische nauwkeurigheid de belangrijkste beoordeling van symptoomcheckers een geschikte triage zijn. Onderscheid maken tussen Rocky Mountain spotted fever en meningitis is mogelijk minder belangrijk dan ervoor te zorgen dat patiënten op zoek gaan naar spoedhulp. Als symptoomcheckers worden gezien als een alternatief voor het simpelweg invoeren van symptomen in een online zoekmachine zoals Google, dan zijn symptoomcheckers waarschijnlijk een superieur alternatief. Een recent onderzoek heeft uitgewezen dat bij het typen van acute symptomen die dringend medische aandacht vereisen in zoekmachines om symp – tom-gerelateerde websites te identificeren, advies om opkomende zorg te zoeken slechts 64% van de tijd aanwezig was. 3 Misschien wel de meest geschikte vergelijking met symp – tom checkers zijn telefoontriage-lijnen, die veel worden gebruikt in ontwikkelde landen.15-18 In het algemeen gebruiken patiënten symptoomcheckers en telefonische triage voor soortgelijke klachten.13 gebruik dezelfde onderliggende klinische logica als de symptoomcheckers die in dit onderzoek zijn geëvalueerd. Sommige triage-lijnen voor gezondheidsplannen gebruiken bijvoorbeeld de Healthwise-symptoomchecker, en de Schmitt- en Thompson-protocollen zijn oorspronkelijk ontwikkeld voor telefoontriage en bieden nu de onderliggende logica voor verschillende symptoomcheckers die we hebben geëvalueerd. De nauwkeurigheid van aanbevelingen voor telefonische triage, in vergelijking met aanbevelingen van persoonlijke artsen, varieerde van 61% in een onderzoek naar buikpijn bij kinderen tot 69% in een observatiestudie in meerdere centra.35 36 Een recente studie van NHS Symptom Checkers en de telefonische triage van NHS Direct line vond triage-advies van beide vergelijkbaar. 9 Gezien hun vergelijkbare klinische logica, triageprestaties en hun verwaarloosbare operationele kosten, zouden symptoomcheckers mogelijk een meer kosteneffectieve manier kunnen zijn om triage-advies te geven dan telefoonlijnen met verpleegsters.17
Implicaties voor het gebruik van symptoomcheckers
Zowel symptoomcheckers als telefonische triage zijn gepromoot als een middel om onnodige kantoorbezoeken te verminderen.15 -18 37 De impact van symptoomcheckers op de manier waarop mensen zorg zoeken, hangt af van hoe patiënten reageren op advies, en dit is niet bekend. In één onderzoek toonden gebruikers scepsis over de diagnose die uiteindelijk door een symptoomchecker werd voorgesteld. 6 De risicomijdende aard van het triage-advies van symptoomcheckers is een punt van zorg. In tweederde van de gestandaardiseerde patiëntevaluaties waarbij medische aandacht niet nodig was, vonden we dat symptoomcheckers zorg aanmoedigden. Negatief advies met overdreven risico’s is niet beperkt tot symptoomcontroleurs. Telefonische triage-advies kan ook het onnodig zoeken naar zorg aanmoedigen.32 35 Zo is de telefonische triage-lijn van de NHS, die niet bemand is door gezondheidswerkers, betrokken bij toenemende bezoeken aan spoedeisende hulpafdelingen in het VK.38 Sommige patiënten die online onderzoek doen naar gezondheidsproblemen gemotiveerd door angst, en de opsomming van betreffende diagnoses door symptoomcheckers zou kunnen bijdragen aan hypochondrie en ‘cyberchondrie’, die de escalerende angst beschrijft die gepaard gaat met zelfdiagnose op internet.39-43 Samen zouden verwarring, advies over risicovolle triage en cyberchondrie kunnen betekenen dat symptoomcheckers patiënten aanmoedigen om onnodig zorg te ontvangen en daarmee de uitgaven voor gezondheidszorg verhogen. Begrijpen hoe patiënten het advies van symptoomcheckers interpreteren en gebruiken en de impact van symptoomcheckers op het zoeken naar zorg, moet een belangrijk aandachtspunt zijn voor toekomstig onderzoek. De symptoomcheckers in deze studie vertegenwoordigen de eerste generatie van dergelijke tools, en er zijn verschillende mogelijke verbeteringen die hun prestaties in toekomstige versies kunnen verbeteren. Het opnemen van lokale epidemiologische gegevens kan helpen bij het stellen van diagnoses. Door bijvoorbeeld real-time informatie over de lokale incidentie van ziekte in de gemeenschap toe te voegen, werden de prestaties van een diagnostisch hulpmiddel voor groep A streptokokkenfaryngitis aanzienlijk verbeterd.10 De diagnose en triagecijfers zouden ook kunnen worden verbeterd als symptoomcheckers individuele klinische gegevens van medische claims zouden opnemen. of het elektronisch medisch dossier. Demografische informatie is van cruciaal belang voor zowel diagnostische als triagebeslissingen voor programma’s zoals symptoomcheckers.11 Een verrassende bevinding in ons onderzoek was dat symptoomcheckers die om demografische achtergrondinformatie vroegen, niet beter presteerden. Het is echter mogelijk dat deze demografische informatie niet effectief is verwerkt in de algoritmen van de symptoomcheckers.
Sterke punten en beperkingen van deze studie
Ondanks het toenemende gebruik van symptoomcheckers, zijn wij van mening dat onze studie de eerste is die de klinische prestaties beoordeelt bij een groot aantal symptoomcheckers en een breed scala aan aandoeningen. Er waren belangrijke beperkingen aan dit onderzoek. We kunnen er niet zeker van zijn dat we alle openbaar beschikbare symptoomcheckers hebben geïdentificeerd, ondanks een grondig onderzoek in relevante databases en overleg met experts op dit gebied. We gebruikten klinische vignetten waarin de symptomen en diagnoses doorgaans duidelijk waren, en enkele vignetten bevatten comorbide aandoeningen, wat resulteerde in een mogelijke overschatting van de werkelijke klinische nauwkeurigheid van symptoomcheckers.33 Sommige gestandaardiseerde patiëntvignetten bevatten specifieke klinische taal (bijvoorbeeld aften amandelen met exsudaat), en echte patiënten met dezelfde aandoening kunnen moeite hebben met de woorden die ze moeten gebruiken om hun symptomen te beschrijven of met andere termen. Daarom vertegenwoordigt onze analyse een indirecte beoordeling van hoe goed symptoomcheckers zouden presteren bij echte patiënten. We weten niet hoe goed artsen of andere zorgverleners een diagnose of triage zouden stellen als ze deze gestandaardiseerde patiëntenvignetten zouden krijgen, waardoor een directe vergelijking tussen symptoomcontroleurs en artsen wordt voorkomen. Toen symptoomcheckers verschillende zorglocaties voorstelden (bijvoorbeeld spoedeisende hulp of huisartsenpraktijk), was onze triage-beoordeling alleen gebaseerd op de meest genoemde zorglocatie, en dit kan bijdragen aan onze bevinding dat triage-advies risicomijdend is. Symptoomcheckers maken deel uit van een grotere trend dat zowel patiënten als artsen het internet voor veel zorgtaken gebruiken en daarom lijkt het aannemelijk dat het gebruik van symptoomcheckers alleen maar zal toenemen. Patiënten chatten online met artsen, 44 e-mailen hun artsen voor medisch advies, 45 ontvangen zorg via e-bezoeken, 46 47 en downloaden gezondheidsapps naar smartphones.48 Behalve het publiek gebruiken artsen en andere beoefenaars ook conceptueel vergelijkbare tools om hulp bij de diagnose en triage van hun patiënten 49 50 Artsen dienen zich ervan bewust te zijn dat een toenemend aantal van hun patiënten nieuwe internethulpmiddelen zoals symptoomcheckers gebruikt en dat de diagnose en triage-adviezen die patiënten krijgen vaak onnauwkeurig zijn. Voor patiënten impliceren onze resultaten dat symptoomcheckers de gebruiker in veel gevallen een idee kunnen geven van mogelijke diagnoses, maar ook een waarschuwing kunnen geven, aangezien de tools vaak verkeerd zijn en het triage-advies overdreven voorzichtig. Symptoomcheckers kunnen echter van waarde zijn als het alternatief geen advies vraagt of simpelweg een internetzoekmachine gebruikt. Verdere evaluaties en monitoring van symptoomcheckers zullen belangrijk zijn om te beoordelen of ze mensen helpen meer te leren en betere beslissingen te nemen over hun gezondheid.
Medewerkers: Alle auteurs hebben de studie bedacht en ontworpen. HLS heeft de gegevens verzameld en het manuscript opgesteld. HLS en AM hebben de gegevens geanalyseerd en geïnterpreteerd. CG, JAL en AM hebben het manuscript kritisch herzien voor belangrijke intellectuele inhoud. HLS en AM hebben de statistische analyse uitgevoerd. AM bood administratieve, technische en materiële ondersteuning en begeleidde het onderzoek. AM staat garant.
Financiering: Deze studie werd gefinancierd door het Amerikaanse National Institute of Health (National Institute of Allergy and Infectious Disease subsidie nr. R21 AI097759-01).
Concurrerende belangen: Alle auteurs hebben het uniforme ICMJE-openbaarmakingsformulier op http://www.icmje.org/coi_disclosure.pdf ingevuld en verklaren: alle auteurs zijn aangesloten bij de Harvard Medical School. De Family Health Guide van Harvard Medical School wordt gebruikt als basis voor een van de geëvalueerde symptoomcheckers. Deze symptoomchecker is zowel in gedrukte vorm als online beschikbaar (www.health.harvard.edu/family_health_ guide / symptomen). Geen van de auteurs is of is van plan betrokken te zijn bij de ontwikkeling, evaluatie, promotie of enig ander facet van een aan Harvard Medical School gerelateerde symptoomchecker; de auteurs hebben geen steun van enige organisatie voor het ingezonden werk; geen financiële relaties met organisaties die mogelijk belang hebben bij het ingediende werk in de afgelopen drie jaar; geen andere relaties of activiteiten die het ingezonden werk zouden kunnen hebben beïnvloed.
Ethische goedkeuring: niet vereist
Gegevens delen: geen aanvullende gegevens beschikbaar.
Transparantie: de garantsteller (AM) bevestigt dat het manuscript een eerlijk, nauwkeurig en transparant verslag is van het onderzoek dat wordt gerapporteerd; dat er geen belangrijke aspecten van het onderzoek zijn weggelaten; en dat eventuele afwijkingen van het geplande onderzoek (en, indien relevant, geregistreerd) zijn toegelicht. Dit is een Open Access-artikel dat wordt gedistribueerd in overeenstemming met de Creative Commons Attribution Non Commercial (CC BY-NC 4.0) -licentie, waarmee anderen dit werk niet-commercieel kunnen distribueren, remixen, aanpassen, erop voortbouwen en hun afgeleide werken in licentie kunnen geven op verschillende voorwaarden, op voorwaarde dat het originele werk correct wordt geciteerd en het gebruik niet commercieel is. Zie: http://creativecommons.org/licenses/ by-nc / 4.0 /.
- Gann B. Patiënten keuze en controle geven: gezondheidsinformatica op de reis van de patiënt. Yearb Med Inform 2012; 7: 70-3.
- Fox S, Duggan M. Health Online 2013. Internet en Amerikaans levensproject. Pew Research Center en California Health Care Foundation, 2013: 4.
- North F, Ward WJ, Varkey P, et al. Moet u op internet zoeken naar informatie over uw acute symptoom? Telemed JE Health 2012; 18: 213-8.
- Black P. De gevaren van het gebruik van Google als diagnostisch hulpmiddel. Br J Nurs 2009; 18: 1157.
- Zhongbo C, Turner MR. Het internet voor zelfdiagnose en prognosticatie bij ALS. Amyotrofe laterale scler 2010; 11: 566.
- Luger TM, Houston TK, Suls J. Ervaring van oudere volwassenen met online diagnose: resultaten van een op scenario’s gebaseerd hardop-denkprotocol. J Med Internet Res 2014; 16: e16.
- Bisson LJ, Komm JT, Bernas GA, et al. Nauwkeurigheid van een computergebaseerd diagnostisch programma voor ambulante patiënten met kniepijn. Am J Sports Med 2014; 42: 2371-6.
- Farmer SE, Bernardotto M, Singh V. Hoe goed is de zelfdiagnose via internet van KNO-symptomen met behulp van Boots WebMD symptoomchecker? Clin Otolaryngol 2011; 36: 517-8.
- Elliot AJ, Kara EO, Loveridge P, et al. Op internet gebaseerde gegevens over zelfcontrole van gezondheid op afstand als adjuvans bij een nationaal syndromaal surveillancesysteem. Epidemiol Infect 2015: 1-7.
- Fine AM, Nizet V, Mandl KD. Participatieve geneeskunde: een thuisscore voor streptokokkenfaryngitis mogelijk gemaakt door real-time biosurveillance: een cohortonderzoek. Ann Intern Med 2013; 159: 577-83.
- DocBot: een nieuw algoritme ter ondersteuning van klinische besluitvorming. Engineering in Medicine and Biology Society (EMBC), 2014 36e jaarlijkse internationale conferentie van de IEEE; 2014 26-30 augustus 2014.
- Lupton D, Jutel A. ‘Het is alsof je een dokter in je zak hebt!’ Een kritische analyse van smartphone-apps voor zelfdiagnose. Soc Sci Med 2015; 133: 128-35.
- North F, Varkey P, Laing B, et al. Zijn webgebruikers van e-health op zoek naar andere symptoominformatie dan bellers naar triagecentra? Telemed JE Health 2011; 17: 19-24.
- Reuters. Aetna brengt nieuwe iTriage-werkgeverstechnologie naar middelgrote bedrijven, 2013.
- Lattimer V, George S, Thompson F, et al. Veiligheid en effectiviteit van telefonische consultatie door verpleegkundigen in de eerste lijn buiten kantooruren: gerandomiseerde gecontroleerde studie. De South Wiltshire Out of Hours Project (SWOOP) Group. BMJ 1998; 317: 1054-9.
- Bunn F, Byrne G, Kendall S. De effecten van telefonisch consult en triage op het gebruik van gezondheidszorg en patiënttevredenheid: een systematische review. Br J Gen Pract 2005; 55: 956-61.
- Campbell J, Fletcher E, Britten N, et al. Telefonische triage voor het beheer van consultatieverzoeken op dezelfde dag in de huisartspraktijk (de ESTEEM-trial): een cluster-gerandomiseerde gecontroleerde trial en kostensequentieanalyse. Lancet 2014; 384: 1859-1868.
- Richards D, Meakins J, Tawfik J, et al. Telefonische triage van verpleegkundigen bij afspraken op dezelfde dag in de huisartspraktijk: meerdere onderbroken tijdreeksen testen effect op werkdruk en kosten. BMJ 2002; 325.1214
- Lewis TL, Wyatt JC. mHealth en mobiele medische apps: een kader om risico’s te beoordelen en veiliger gebruik te bevorderen. J Med Internet Res 2014; 16: e210.
- 113e Amerikaanse Congres. Verbetering van medische elektronische datatechnologie voor de gezondheid van consumenten (MEDTECH), 2014.
- Saczynski J, Yarzebski J, Lessard D, et al. Trends in uitstel vóór het ziekenhuis bij patiënten met een acuut myocardinfarct (uit de Worcester Heart Attack Study). Ben J Cardiol 2008; 102: 1591.
- Barnett ML, Linder JA. Antibioticumvoorschrift voor volwassenen met acute bronchitis in de Verenigde Staten, 1996-2010. JAMA 2014; 311: 2020-2.
- Barnett ML, Linder JA. Antibioticum voorschrijven aan volwassenen met keelpijn in de Verenigde Staten, 1997-2010. JAMA Intern Med 2014; 174: 138-40.
- Gonzales R, Malone DC, Maselli JH, et al. Overmatig gebruik van antibiotica voor acute luchtweginfecties in de Verenigde Staten. Clin Infect Dis 2001; 33: 757-62.
- Little P, Rumsby K, Kelly J, et al. Bijsluiter en voorschrijfstrategieën voor antibiotica voor acute infectie van de onderste luchtwegen: een gerandomiseerde gecontroleerde studie. JAMA 2005; 293: 3029-35.
- Bierbrier R, Lo V, Wu RC. Evaluatie van de nauwkeurigheid van medische rekenapps voor smartphones. J Med Internet Res 2014; 16: e32.
- Orizio G, Merla A, Schulz PJ, et al. Kwaliteit van online apotheken en websites die geneesmiddelen op recept verkopen: een systematische review. J Med Internet Res 2011; 13: e74.
- Schmitt BD. Pediatrische telefoonprotocollen: kantoorversie. American Academy of Pediatrics, 2012.
- Thompson DA. Telefoonprotocollen voor volwassenen, 3e edn. American Academy of Pediatrics, 2013.
- Epocrates. 2014. www.epocrates.com/ .
- CDC, NAMCS, NHAMCS. Jaarlijks aantal en procentuele verdeling van ambulante zorgbezoeken naar type instelling volgens diagnosegroep: Verenigde Staten, 2009-2010, 2010.
- Poote A, French D, Dale J, et al. Een onderzoek naar geautomatiseerde zelfevaluatie in de instelling van een studentengezondheidscentrum in de eerstelijnszorg. J Telemed Telecare 2014; 20: 125.
- Graber ML. De incidentie van diagnostische fouten in de geneeskunde. BMJ Qual Saf 2013; 22 (Suppl 2): ii21-ii27.
- Meyer AN, Payne VL, Meeks DW, et al. Diagnostische nauwkeurigheid, vertrouwen en hulpverzoeken van artsen: een vignetonderzoek. JAMA Intern Med 2013; 173: 1952-8.
- Staub GM, von Overbeck J, Blozik E. Teleconsultatie bij kinderen met buikpijn: een vergelijking van aanbevelingen voor triage door artsen en een vastgesteld protocol voor telefonische triage bij kinderen. BMC Med Informeert Decis Mak 2013; 13: 110.
- Giesen P, Ferwerda R, Tijssen R, et al. Veiligheid van telefonische triage in huisartsencoöperaties: schatten triageverpleegkundigen de urgentie correct in? Qual Saf Health Care 2007; 16: 181-4.
- Stacey D, Graham I, O’Connor A, Pomey M. Belemmeringen en facilitators die de beslissingsondersteuning van callcenterverpleegkundigen beïnvloeden voor bellers die te maken hebben met waardengevoelige beslissingen: een studie met gemengde methoden. Wereldbeelden Evid Based Nurs 2005; 2: 184-95.
- Donnelly L. A&E Crisisoorzaak door NHS 111-telefoonlijn, suggereert senior medic. Telegraph 14 januari 2015.
- Usborne S. Cyberchondria: de gevaren van zelfdiagnose via internet. Onafhankelijk. 17 februari 2009.
- Hartzband P, Groopman J. Het web ontwarren – Patiënten, artsen en internet. N Engl J Med 2010; 362: 1064.
- Brigo F, Igwe SC, Ausserer H, et al. Waarom Google-epilepsie? Een infodemiologische studie van online gedrag voor aan epilepsie gerelateerde zoektermen. Epilepsiegedrag 2014; 31: 67-70.
- White RW, Horvitz E. Ervaringen met zoeken op het web over medische zorgen en zelfdiagnose. AMIA Annu Symp Proc 2009; 2009: 696-700.
- Husain I, Spence D. Kunnen gezonde mensen profiteren van gezondheidsapps? BMJ 2015; 350: h1887.
- Eminovic N, Wyatt J, Tarpey A, et al. Eerste evaluatie van de NHS Direct Online Clinical Inquiry Service: een door verpleegkundigen geleide webchat-triage-service voor het publiek. J Med Internet Res 2004; 6: e17.
- Eysenbach G, Diepgen T. Patiënten die informatie zoeken op internet en teleadvies zoeken. Arch Dermatol 1999; 135: 151-6.
- Mehrotra A, Paone S, Martich GD, et al. Een vergelijking van zorg bij e-bezoeken en doktersbezoeken voor sinusitis en urineweginfectie. JAMA Intern Med 2013; 173: 72-4.
- DeJong C, Santa J, Dudley RA. Websites die zorg bieden via internet: is er een compromis over toegangskwaliteit? JAMA 2014; 311: 1287-8.
- Edney A. De FDA zet haar zinnen op medische apps: Bloomberg Businessweek, 20 september 2013.
- Cook DA, Enders F, Linderbaum JA, et al. Snelheid en nauwkeurigheid van een point-of-care webgebaseerde kennisbron voor clinici: een gecontroleerde cross-over studie. Interactie J Med Res 2014; 3: e7.
- Sadeghi S, Barzi A, Sadeghi N, et al. Een Bayesiaans model voor ondersteuning van triagebeslissingen. Int J Med Inform 2006; 75: 403-11.