Med7 : un modèle clinique transférable de traitement du langage naturel pour les dossiers de santé électroniques (2023)

L'intelligence artificielle en médecine

Tome 118,

Août 2021

, 102086

Les liens d'auteur ouvrent le panneau de superposition, , ,

Abstrait

Les systèmes de dossiers de santé électroniques sont omniprésents et la majorité des données des patients sont désormais collectées par voie électronique sous forme de texte libre. L'apprentissage en profondeur a considérablement fait progresser le domaine du traitement du langage naturel et l'apprentissage par représentation auto-supervisé et l'apprentissage par transfert sont devenus les méthodes de choix en particulier lorsque les données annotées de haute qualité sont limitées. L'identification des concepts médicaux et l'extraction d'informations sont une tâche difficile, mais un ingrédient important pour l'analyse des données non structurées dans un format structuré et tabulé pour les tâches analytiques en aval. Dans ce travail, nous avons introduit un modèle de reconnaissance d'entités nommées (NER) pour le traitement clinique du langage naturel. Le modèle est formé pour reconnaître sept catégories : noms de médicaments, voie d'administration, fréquence, dosage, force, forme, durée. Le modèle a d'abord été pré-formé sur la tâche de prédire le mot suivant, en utilisant une collection de 2 millions d'enregistrements de patients en texte libre à partir de corpus MIMIC-III, suivi d'un ajustement sur la tâche de reconnaissance d'entité nommée. Le modèle a atteint une micro-moyenneF1 score de 0,957 dans les sept catégories. De plus, nous avons évalué la transférabilité du modèle développé en utilisant les données de l'unité de soins intensifs aux États-Unis vers les dossiers de santé mentale des soins secondaires (CRIS) au Royaume-Uni. Une application directe du modèle NER formé aux données CRIS a entraîné une réduction des performances deF1 = 0,762, cependant après un réglage fin sur un petit échantillon de CRIS, le modèle a atteint une performance raisonnable deF1=0,944. Cela a démontré que malgré une similitude étroite entre les ensembles de données et les tâches NER, il est essentiel d'affiner les données du domaine cible afin d'obtenir des résultats plus précis. Le modèle résultant et les représentations vectorielles pré-entraînées sont disponibles surhttps://github.com/kormilitzin/med7.

Introduction

Ces dernières années ont vu des avancées technologiques remarquables dans les plateformes numériques pour la médecine et les soins de santé. La majorité des dossiers médicaux des patients sont désormais collectés par voie électronique et représentent des opportunités sans précédent pour la recherche, la prestation de meilleurs soins de santé et l'amélioration des résultats pour les patients. Une quantité importante d'informations sur les patients est recueillie sous forme de texte libre par des cliniciens, des infirmières et des soignants au cours d'entretiens et d'évaluations. Les dossiers médicaux textuels contiennent des informations riches sur l'histoire d'un patient telles qu'elles sont exprimées en langage naturel et permettent de refléter des détails nuancés. Cependant, les textes libres posent certains défis dans leur utilisation directe par opposition aux sources de données structurées et prêtes à l'emploi. Le traitement manuel de tous les enregistrements en texte libre des patients limite considérablement l'utilisation de données non structurées et rend le processus d'exploration de données non évolutif. Les algorithmes d'apprentissage automatique sont bien placés pour traiter une grande quantité de données, repérer des interactions inhabituelles et extraire des informations significatives. Des lignes de recherche récentes dans le domaine du traitement du langage naturel (PNL), telles que les représentations de mots contextualisées profondes [1], les architectures basées sur les transformateurs [2] et les grands modèles de langage [3], ont montré leur utilité pour le traitement clinique du langage naturel avec des outils médicaux non structurés. enregistrements [4]. Malgré les avancées technologiques dans les modèles de PNL, il existe un certain nombre de défis pertinents dans le domaine de la PNL clinique qui doivent être relevés afin de développer des modèles fiables pour l'extraction d'informations. Le principal défi est le manque d'exemples annotés de haute qualité pour former de manière robuste des modèles généralisables. De grandes quantités de données médicales ne peuvent pas être rendues publiques pour les annotations de crowdsourcing, similaires à ImageNet [5], [6] ou au moyen d'Amazon Mechanical Turk, en raison d'une considération éthique de la préservation de la vie privée des patients et de la sécurité des informations [7]. Par conséquent, la plupart des annotations de données sont effectuées par un nombre limité d'experts du domaine, tels que des cliniciens ou des infirmières, et ne peuvent pas être partagées. Depuis 2006, l'initiative Informatics for Integrating Biology and the Bedside (i2b2) [8] organise régulièrement des défis sur le traitement clinique du langage naturel et les organisateurs fournissent un échantillon de données annotées soigneusement sélectionnées pour chaque tâche particulière, entièrement anonymisées et provenant du Base de données des dossiers de santé électroniques MIMIC-III (Medical Information Mart for Intensive Care-III) [9].

L'identification des concepts d'intérêt dans les textes libres est une sous-tâche de l'extraction d'informations (IE), plus communément appelée reconnaissance d'entité nommée (NER). La tâche NER cherche à classer les mots dans des catégories prédéfinies [10] et à leur attribuer des étiquettes. Un modèle NER robuste et précis pour l'identification de concepts médicaux, tels que les noms de médicaments, la force, la fréquence d'administration, les symptômes signalés, les diagnostics, le score de santé et bien d'autres, est un élément essentiel et fondamental de tout système d'EI clinique. Cependant, afin de développer un modèle NER fiable et généralisable pour les données d'observation du monde réel, il faut d'abord relever un certain nombre de défis.

Malgré la disponibilité des données i2b2 annotées et de l'ensemble de la base de données des dossiers de santé électroniques (DSE) MIMIC-III, il n'est pas garanti que les modèles développés à l'aide de ces sources de données se généralisent de manière robuste sur d'autres ensembles de données DSE similaires, même sur les mêmes tâches en aval. . De nombreux algorithmes d'apprentissage supervisé sont basés sur l'hypothèse que les ensembles d'apprentissage et de test sont échantillonnés à partir de la même distribution. Cependant, lorsque les domaines cible et source sont différents, on s'attend à ce que le modèle sous-performe [11]. L'une des solutions potentielles à la transférabilité d'un modèle formé pour reconnaître des concepts à partir de données étiquetées dans un domaine source qui fonctionne également bien sur un domaine cible différent mais connexe, considéré comme l'adaptation de domaine [12], [13].

Dans cette étude, nous abordons les problèmes susmentionnés en mettant en œuvre trois stratégies. Tout d'abord, le modèle de langage de réseau neuronal profond sous-jacent a été pré-formé de manière auto-supervisée sur l'ensemble du corpus de notes cliniques du MIMIC-III comprenant plus de 2 millions de documents en texte libre en utilisant l'approche de style cloze [14], où certains mots sont masqués et doivent être prédits compte tenu du reste du texte. Deuxièmement, en utilisant la méthode de supervision faible [15], nous avons développé des données d'apprentissage synthétiques avec des étiquettes bruitées. Enfin, nous avons incorporé tous les ingrédients dans une approche d'apprentissage actif, dans laquelle un modèle NER de correspondance de modèle de base a été utilisé pour suggérer de manière proactive des étendues dans le texte invisible qui appartiennent très probablement aux catégories d'intérêt et ont permis à un annotateur humain d'examiner les suggestions, de corriger si nécessaire et pour générer plus efficacement des annotations de référence.

De plus, nous avons démontré que le modèle NER développé formé sur un domaine source à partir des données MIMIC EHR des soins intensifs aux États-Unis, n'a pas réussi à bien généraliser sur le domaine cible provenant de la plate-forme UK Clinical Record Interactive Search (UK-CRIS), qui est le la plus grande base de données sur la santé mentale des soins secondaires au Royaume-Uni. Cependant, en utilisant l'adaptation de domaine et le réglage fin sur UK-CRIS, nous avons montré que le modèle NER pouvait conserver ses performances sur UK-CRIS.

Extraits de section

Travaux connexes

Le sujet du traitement clinique du langage naturel et de l'extraction d'informations a fait l'objet de recherches actives au cours des trois dernières décennies, en particulier avec l'introduction et l'adoption de plateformes de dossiers de santé électroniques. Les méthodes ont évolué de simples systèmes logiques et basés sur des règles à des architectures complexes d'apprentissage en profondeur [16], [17]. L'une des approches courantes de l'extraction d'informations consiste à transformer des données de texte libre en représentation codée via des tables de recherche, telles que des

Matériels et méthodes

Le développement du modèle Med7 NER a combiné deux processus profondément interconnectés : la génération de données et la formation du modèle. L'ensemble de données pour la formation comprenait une combinaison de corpus annotés or et argent. La phase de développement du modèle comprenait une pré-formation auto-supervisée et une optimisation des hyperparamètres pour obtenir à la fois une précision élevée et une généralisation robuste. Les textes cliniques proviennent des bases de données MIMIC-III et UK-CRIS.

Modèle de reconnaissance d'entité nommée

Les résultats de l'évaluation du modèle Med7 NER développé sont résumés dans le tableau 4 à l'aide des données présentées dans le tableau 1. Une matrice de confusion détaillée au niveau des jetons des prédictions du modèle est présentée à l'annexe A du tableau 8.

Les matrices de confusion explicites au niveau du jeton des deux annotateurs par rapport à l'étalon-or sont présentées dans le tableau 10 et le tableau 11 en conséquence. Les statistiques récapitulatives obtenues et l'accord inter-annotateurs (IAA) en termes deF1 score de 0,924 entre l'or n2c2

Discussion

Le modèle de reconnaissance d'entités nommées développé pour les concepts cliniques dans les dossiers médicaux non structurés a été formé pour reconnaître sept catégories, telles que les noms de médicaments, y compris les noms génériques et de marque, le dosage des médicaments, leur force, la voie d'administration, la durée de la prescription et le fréquence. Les données pour le développement et les tests de modèles proviennent du défi n2c2, comprenant une collection de 303 et 202 documents pour la formation et les tests respectivement, ce qui représente un

Conclusion

Dans ce travail, nous avons développé et validé un modèle clinique de reconnaissance d'entités nommées pour les dossiers de santé électroniques en texte libre. Le modèle a été développé à l'aide des données en texte libre MIMIC-III et formé sur une combinaison des données annotées manuellement du défi n2c2 2018, sur un échantillon aléatoire de MIMIC-III avec des étiquettes bruyantes et des données annotées manuellement à l'aide d'un outil d'apprentissage actif. Pour maximiser l'utilisation d'une grande quantité de données en texte libre non structurées et atténuer le problème de la formation

Disponibilité des données

Les données qui étayent les conclusions de cette étude sont disponibles sur demande via le réseau UK-CRIS. En raison de la sensibilité des informations cliniques sur les soins secondaires, l'accès dépend de l'obtention des approbations de recherche des organismes de surveillance du NHS Trust à Oxford Health NHS Foundation Trust.

Remerciements

L'étude a été financée par le Centre de recherche biomédicale Oxford Health du National Institute for Health Research (NIHR) (BRC-1215-20005). Ce travail a été soutenu par le système UK Clinical Records Interactive Search (UK-CRIS) financé et développé par le NIHR Oxford Health BRC à Oxford Health NHS Foundation Trust et le Département de psychiatrie de l'Université d'Oxford. AK, NV, QL, ANH sont financés par la subvention MRC Pathfinder (MC_PC_17215). Nous remercions les organisateurs du Challenge n2c2 2018

Les références(71)

  • SVelupillaiet coll.

    Utilisation du traitement clinique du langage naturel pour la recherche sur les résultats en matière de santé : aperçu et suggestions concrètes pour de futures avancées

    J Biomed Inf

    (2018)

  • E.Entzéridouet coll.

    Attentes du public et des médecins et préoccupations éthiques concernant le dossier de santé électronique : les avantages l'emportent sur les risques, sauf pour la sécurité de l'information

    Int J Med Inf

    (2018)

  • Ö.Uzonneret coll.

    Identification du statut tabagique du patient à partir des dossiers médicaux de sortie

    J Am Med Inf Assoc

    (2008)

  • HGurulingappaet coll.

    Développement d'un corpus de référence pour soutenir l'extraction automatique des effets indésirables liés aux médicaments à partir des rapports de cas médicaux

    J Biomed Inf

    (2012)

  • LGligiqueet coll.

    Reconnaissance d'entités nommées dans les dossiers de santé électroniques à l'aide de réseaux de neurones amorcés par apprentissage par transfert

    Les réseaux de neurones

    (2020)

  • Y.Wanget coll.

    Un paradigme de classification de textes cliniques utilisant une supervision faible et une représentation profonde

    BMC informatique médicale et prise de décision

    (2019)

  • MOI.Pierreset coll.

    Représentations de mots profondément contextualisées

    (2018)

  • UN.Vaswaniet coll.

    L'attention est tout ce dont vous avez besoin

    Progrès dans les systèmes de traitement de l'information neuronale

    (2017)

  • JDevlinet coll.

    Bert : pré-formation de transformateurs bidirectionnels profonds pour la compréhension du langage

    (2018)

  • JDénget coll.

    ImageNet : une base de données d'images hiérarchique à grande échelle

    CVPR09

    (2009)

  • TLinet coll.

    COCO : objets communs en contexte

    (2014)

  • P.E.Johnsonet coll.

    Mimic-iii, une base de données de soins intensifs librement accessible

    Données scientifiques

    (2016)

  • HProtégeret coll.

    Introduction à la recherche d'informations

    Actes de la communication internationale de l'association pour la conférence sur les machines informatiques, Vol. 4

    (2008)

  • V.M.Patelet coll.

    Adaptation au domaine visuel : tour d'horizon des avancées récentes

    IEEE Signal Process Mag

    (2015)

  • Y.Voyantet coll.

    Entraînement domaine-adversaire des réseaux de neurones

    J Mach Learn Res

    (2016)

  • JE.Bon garçonet coll.

    L'apprentissage en profondeur

    (2016)

  • UN.Baïevskiet coll.

    Préformation axée sur Cloze des réseaux d'auto-attention

    (2019)

  • A.J.Ratneret coll.

    Le rôle de la supervision massivement multitâche et faible dans le logiciel 2.0

    CIDR

    (2019)

  • Hde Dalian

    Exploration de textes cliniques : utilisation secondaire des dossiers électroniques des patients

    (2018)

  • SWuet coll.

    Apprentissage profond dans le traitement clinique du langage naturel : une revue méthodique

    J Am Med Inf Assoc

    (2020)

  • O.Bodenreider

    Le système de langage médical unifié (UMLS) : intégrer la terminologie biomédicale

    Acides nucléiques Res

    (2004)

  • G.Zhouet coll.

    Reconnaissance d'entités nommées à l'aide d'un étiqueteur de blocs basé sur HMM

    Actes de la 40e réunion annuelle de l'Association for Computational Linguistics, Association for Computational Linguistics

    (2002)

  • A.R.Aronson

    Cartographie efficace du texte biomédical vers le Metathesaurus de l'UMLS : le programme MetaMap

    Actes du symposium AMIA, American Medical Informatics Association

    (2001)

  • MKay

    Schémas d'algorithmes et structures de données dans le traitement syntaxique, rapport technique

    (1980)

  • HXuet coll.

    Medex : un système d'extraction d'informations sur les médicaments pour les récits cliniques

    J Am Med Inf Assoc

    (2010)

  • S.R.Jonnalagaddaet coll.

    Analyse de coréférence dans les notes cliniques : un tamis multi-passes avec des modules de résolution d'anaphores alternatives

    J Am Med Inf Assoc

    (2012)

  • MToriiet coll.

    Utilisation de l'apprentissage automatique pour l'extraction de concepts sur des documents cliniques à partir de plusieurs sources de données

    J Am Med Inf Assoc

    (2011)

  • SSöhnet coll.

    Détection complète des informations temporelles à partir du texte clinique : événements médicaux, heure et identification TLINK

    J Am Med Inf Assoc

    (2013)

  • G. K.Savovaet coll.

    Mayo Clinical Text Analysis and Knowledge Extraction System (cTAKES) : architecture, évaluation des composants et applications

    J Am Med Inf Assoc

    (2010)

  • SSöhnet coll.

    Medxn : un outil open source d'extraction et de normalisation de médicaments pour le texte clinique

    J Am Med Inf Assoc

    (2014)

  • E.génériqueet coll.

    Clamp - une boîte à outils pour créer efficacement des pipelines de traitement clinique du langage naturel personnalisés

    J Am Med Inf Assoc

    (2018)

  • HCunninghamet coll.

    Tirer le meilleur parti des documents biomédicaux grâce à l'analyse de texte open source du cycle de vie complet de gate

    PLoS Comput Biol

    (2013)

  • TMikolovet coll.

    Représentations distribuées de mots et de phrases et leur compositionnalité

    Progrès dans les systèmes de traitement de l'information neuronale

    (2013)

  • JPenningtonet coll.

    Gant : vecteurs globaux pour la représentation des mots

    Actes du colloque 2014 sur les méthodes empiriques en traitement automatique du langage naturel (EMNLP)

    (2014)

  • KSKalyanet coll.

    Secnlp : une enquête sur les intégrations dans le traitement clinique du langage naturel

    (2019)

  • Cité par (25)

    • Identifier les preuves quantifiées liées à l'AVC à partir des dossiers de santé électroniques dans des études du monde réel

      2023, Intelligence Artificielle en Médecine

      L'AVC est l'une des principales causes de décès et d'invalidité dans le monde. Les scores des National Institutes of Health Stroke Scale (NIHSS) dans les dossiers de santé électroniques (DSE), qui décrivent quantitativement les déficits neurologiques des patients dans le cadre d'un traitement fondé sur des données probantes, sont cruciaux dans les investigations cliniques liées à l'AVC. Cependant, le format de texte libre et le manque de normalisation entravent leur utilisation efficace. L'extraction automatique des scores d'échelle du texte libre clinique afin que sa valeur potentielle dans les études du monde réel soit réalisée est devenue un objectif important.

      Cette étude vise à développer une méthode automatisée pour extraire les scores d'échelle à partir du texte libre des DSE.

      Nous proposons une méthode de pipeline en deux étapes pour identifier les éléments du NIHSS et les scores numériques et valider sa faisabilité à l'aide d'une base de données de soins intensifs librement accessible : MIMIC-III (Medical Information Mart for Intensive Care III). Tout d'abord, nous utilisons MIMIC-III pour créer un corpus annoté. Ensuite, nous étudions les méthodes d'apprentissage automatique possibles pour deux sous-tâches, la reconnaissance d'items et de scores NIHSS et l'extraction de la relation item-score. Dans l'évaluation, nous effectuons des évaluations spécifiques à la tâche et de bout en bout et comparons notre méthode avec la méthode basée sur des règles en utilisant la précision, le rappel et les scores F1 comme mesures d'évaluation.

      Nous utilisons tous les résumés de sortie disponibles des cas d'AVC dans MIMIC-III. Le corpus NIHSS annoté contient 312 cas, 2929 items d'échelle, 2774 scores et 2733 relations. Les résultats montrent que le meilleur score F1 de notre méthode était de 0,9006, obtenu en combinant BERT-BiLSTM-CRF et Random Forest, et il a surpassé la méthode basée sur des règles (score F1 = 0,8098). Dans la tâche de bout en bout, notre méthode a pu reconnaître avec succès l'item "1b niveau de conscience questions", le score "1" et leur relation "('1b niveau de conscience questions', '1', 'a de la valeur' ) » de la phrase « 1b niveau de conscience questions : ledit nom = 1 », alors que la méthode basée sur des règles ne le pouvait pas.

      La méthode de pipeline en deux étapes que nous proposons est une approche efficace pour identifier les éléments, les scores et leurs relations du NIHSS. Avec son aide, les chercheurs cliniques peuvent facilement récupérer et accéder à des données d'échelle structurées, soutenant ainsi les études du monde réel liées à l'AVC.

    • Traitement du langage naturel dans les dossiers de santé électroniques en relation avec la prise de décision en matière de soins de santé : une revue systématique

      2023, Informatique en Biologie et Médecine

      Le traitement du langage naturel (NLP) est largement utilisé pour extraire des informations cliniques des dossiers de santé électroniques (DSE). Cependant, le manque de données annotées, d'outils automatisés et d'autres défis entravent la pleine utilisation de la PNL pour les DSE. Diverses techniques d'apprentissage automatique (ML), d'apprentissage en profondeur (DL) et de PNL sont étudiées et comparées pour comprendre de manière exhaustive les limites et les opportunités de cet espace.

      Après avoir examiné 261 articles de 11 bases de données, nous avons inclus 127 articles pour une revue de texte intégral couvrant sept catégories d'articles : (1) classification des notes médicales, (2) reconnaissance d'entités cliniques, (3) résumé de texte, (4) apprentissage en profondeur (DL ) et l'architecture d'apprentissage par transfert, (5) l'extraction d'informations, (6) la traduction en langage médical et (7) d'autres applications PNL. Cette étude suit les lignes directrices PRISMA (Preferred Reporting Items for Systematic Reviews and Meta-Analyses).

      Le DSE était le type de données le plus couramment utilisé parmi les articles sélectionnés, et les ensembles de données étaient principalement non structurés. Diverses méthodes ML et DL ont été utilisées, la prédiction ou la classification étant l'application la plus courante de ML ou DL. Les cas d'utilisation les plus courants étaient : la classification internationale des maladies, neuvième révision (CIM-9), l'analyse des notes cliniques et la reconnaissance d'entités nommées (NER) pour les descriptions cliniques et la recherche sur les troubles psychiatriques.

      Nous constatons que les modèles de ML adoptés n'ont pas été évalués de manière adéquate. De plus, le problème du déséquilibre des données est assez important, mais nous devons trouver des techniques pour résoudre ce problème sous-jacent. Les futures études devraient aborder les principales limites des études, en identifiant principalement la néphrite lupique, les tentatives de suicide, l'automutilation périnatale et la classification CIM-9.

    • Améliorer les intégrations de graphes via la liaison d'entités : une étude de cas sur des notes cliniques italiennes

      2023, Systèmes intelligents avec applications

      Extrait de citation :

      C'est l'objectif principal de la médecine de précision, qui a été rendue possible par la disponibilité toujours croissante de documents médicaux numérisés, souvent sous la forme de dossiers de santé électroniques (DSE) (Abul-Husn & Kenny, 2019, Rajkomar et al., 2018 ). Ces documents sont remplis par des infirmières et des médecins dans les services hospitaliers et contiennent des détails sur les admissions à l'hôpital (par exemple, anamnèses, diagnostics, traitements, admissions en USI) avec une approche non structurée ou semi-structurée (Kormilitzin et al., 2021, Negro-Calduch et al ., 2021, Gao et al., 2021). L'absence d'une approche/d'un cadre unifié pour compiler et gérer les notes cliniques, le manque de temps du personnel médical - qui est généralement impliqué dans des activités beaucoup plus importantes - entraînent inévitablement deux problèmes majeurs (Yoon et al., 2019) : (1) l'hétérogénéité des données provenant de différentes sources (c'est-à-dire les hôpitaux, les services ou même les professionnels de la santé) et (2) l'abondance d'abréviations et d'erreurs orthographiques qui, associées aux particularités du texte biomédical caractérisé par des mots polysémiques et des orthographes alternées, rendent extrêmement difficile pour récupérer automatiquement les informations de ces documents.

      La disponibilité toujours croissante des dossiers de santé électroniques (DSE) est le facteur clé demédecine de précision, qui vise à fournir des thérapies et des diagnostics basés non seulement sur la littérature médicale, mais également sur l'expérience clinique et les informations individuelles des patients (par exemple, la génomique, le mode de vie, les antécédents médicaux). La nature non structurée des DSE a posé plusieurs défis quant à leur analyse efficace, et les graphiques hétérogènes sont la solution la plus appropriée pour gérer l'hétérogénéité des informations contenues dans les DSE. Cependant, bien que les DSE soient une source de données extrêmement précieuse, les informations issues de la littérature médicale actuelle n'ont pas encore été prises en compte dans les systèmes d'aide à la décision clinique. Dans ce travail, nous construisons un graphe hétérogène à partir des DSE italiens fournis par l'hôpital de Naples Federico II, et nous définissons un workflow méthodologique nous permettant de prédire la présence d'un lien entre les patients et les maladies diagnostiquées. Nous démontrons empiriquement que la liaison de concepts à des ontologies biomédicales (par exemple UMLS, DBpedia) - qui nous permettent d'extraire des entités et des relations de la littérature médicale - est significativement bénéfique pour notre flux de travail de prédiction de liens en termes d'aire sous la courbe ROC (AUC) et de moyenne. Rang réciproque (MRR).

    • Validation des données de la biobanque britannique pour les résultats en matière de santé mentale : une étude pilote utilisant des dossiers de santé électroniques de soins secondaires

      2022, Revue internationale d'informatique médicale

      Extrait de citation :

      Ces fichiers sont d'une grande valeur pour la recherche médicale car ils contiennent de riches informations sur les patients. Dans la présente étude, les dossiers des médicaments prescrits ainsi que les résultats des tests cognitifs, y compris les échelles de résultats de la santé de la nation (HoNOS), les scores d'évaluation cognitive de Montréal (MoCA) et les scores du mini-examen de l'état mental (MMSE) ont été extraits au moyen d'examens cliniques. modèles de traitement du langage naturel (TAL) [8–12]. Nous avons utilisé un système d'extraction de texte NLP conçu pour CRIS/OX et avons obtenu un score F1 de 92,8 % et 98,03 % pour le diagnostic et la médication respectivement [13].

      UK Biobank (UKB) est largement utilisée pour enquêter sur les troubles de santé mentale et les expositions associées ; cependant, son applicabilité et sa pertinence dans un contexte clinique et les hypothèses requises n'ont pas été suffisamment et systématiquement étudiées. Ici, nous présentons la première étude de validation utilisant des données de soins secondaires sur la santé mentale avec un lien avec UKB d'Oxford - Clinical Record Interactive Search (CRIS) se concentrant sur la comparaison des informations démographiques, des résultats de diagnostic, des dossiers de médicaments et des résultats des tests cognitifs, avec des données manquantes et le biais implicite des deux ressources représentées.

      Nous avons appliqué un modèle de traitement du langage naturel pour extraire des informations intégrées dans un texte non structuré à partir de notes cliniques et de pièces jointes. À l'aide d'un tableau de contingence, nous avons comparé les informations démographiques enregistrées dans UKB et CRIS. Nous avons calculé la valeur prédictive positive (VPP, proportion de cas de vrais positifs détectés) pour le diagnostic de santé mentale et les médicaments pertinents.

      Parmi la cohorte de 854 sujets, les VPP pour tout diagnostic de santé mentale pour la démence, la dépression, le trouble bipolaire et la schizophrénie étaient de 41,6 % et étaient de 59,5 %, 12,5 %, 50,0 % et 52,6 %, respectivement. Les dossiers de médicaments autodéclarés à UKB avaient une VPP générale de 47,0 %, la prévalence des médicaments fréquemment prescrits pour chaque trouble de santé mentale typique étant considérablement différente des informations fournies par le CRIS.

      UKB est hautement multimodal, mais avec des enregistrements de suivi limités, alors que CRIS offre un tableau clinique longitudinal à haute résolution avec plus de dix ans d'observations. Le couplage des deux ensembles de données réduira le biais d'auto-déclaration et augmentera de manière synergique diverses modalités en une ressource unifiée pour faciliter une recherche plus solide en santé mentale.

    Voir tous les articles citant Scopus

    Articles recommandés (6)

    • Article de recherche

      Un modèle de classification progressive en cascade d'ondelettes profondes pour la détection de l'épilepsie

      Intelligence Artificielle en Médecine, Volume 118, 2021, Article 102117

      La détection automatique des crises d'épilepsie selon les enregistrements EEG est utile aux neurologues pour identifier une occurrence d'épilepsie dans le traitement antiépileptique initial. Pour détecter rapidement et avec précision l'épilepsie, nous avons proposé un modèle de classification progressive en cascade d'ondelettes profondes (PDWC) basé sur la transformée discrète en ondelettes (DWT) et la forêt aléatoire (RF). Différent des réseaux profonds actuels, le PDWC imite le processus progressif d'identification d'objets des êtres humains avec des cycles de reconnaissance. Dans chaque cycle, des caractéristiques d'énergie d'ondelettes améliorées à une échelle spécifique ont été extraites par DWT et entrées dans un ensemble de classificateurs RF en cascade pour réaliser une reconnaissance. La précision de reconnaissance du PDWC est progressivement améliorée par la fusion des résultats de classification produits par plusieurs cycles de reconnaissance. De plus, la structure en cascade de PDWC peut être automatiquement déterminée par l'incrément de précision de classification entre les couches. Pour vérifier les performances du PDWC, nous avons respectivement appliqué cinq schémas traditionnels et quatre schémas d'apprentissage en profondeur à quatre ensembles de données publics. Les résultats montrent que le PDWC est non seulement supérieur à cinq schémas traditionnels, y compris KNN, Bayes, DT, SVM et RF, mais aussi meilleur que les méthodes d'apprentissage en profondeur, c'est-à-dire le réseau de neurones convolutifs (CNN), la mémoire à long court terme (LSTM). ), Multi-Grained Cascade Forest (gcForest) et modèle de cascade d'ondelettes (WCM). La précision moyenne du PDWC pour tous les sujets de tous les ensembles de données atteint 0,9914. Avec une structure flexible et moins de paramètres, le PDWC est plus adapté à la détection d'épilepsie de divers signaux EEG.

    • Article de recherche

      Approches d'intelligence artificielle utilisant le traitement du langage naturel pour faire progresser la recherche clinique basée sur le DSE

      Journal of Allergy and Clinical Immunology, Volume 145, Numéro 2, 2020, pp. 463-469

      L'adoption généralisée des systèmes de dossiers de santé électroniques dans les soins de santé génère de grandes données du monde réel qui ouvrent de nouveaux horizons pour mener des recherches cliniques. Comme une grande quantité d'informations cliniques précieuses sont enfermées dans des récits cliniques, les techniques de traitement du langage naturel en tant qu'approche d'intelligence artificielle ont été exploitées pour extraire des informations des récits cliniques dans les dossiers de santé électroniques. Cette capacité de traitement du langage naturel permet potentiellement l'examen automatisé des dossiers pour identifier les patients présentant des caractéristiques cliniques distinctives dans les soins cliniques et réduit l'hétérogénéité méthodologique dans la définition du phénotype, masquant l'hétérogénéité biologique dans la recherche sur les allergies, l'asthme et l'immunologie. Cette brève revue examine la littérature actuelle sur l'utilisation secondaire des données des dossiers de santé électroniques pour la recherche clinique concernant les allergies, l'asthme et l'immunologie et met en évidence le potentiel, les défis et les implications des techniques de traitement du langage naturel.

    • Article de recherche

      Fonctionnalités multiples pour l'extraction de relations cliniques : une approche d'apprentissage automatique

      Journal d'informatique biomédicale, volume 103, 2020, article 103382

      L'extraction de relations vise à découvrir des faits relationnels sur les mentions d'entités à partir de textes bruts. Dans ce travail, nous nous concentrons sur l'extraction des relations cliniques ; à savoir, à partir d'un dossier médical mentionnant les médicaments et leurs attributs, on identifie les relations entre ces entités. Nous proposons un modèle d'apprentissage automatique avec un nouvel ensemble de fonctionnalités basées sur les connaissances et d'intégration de BioSentVec. Nous étudions systématiquement l'impact de ces fonctionnalités avec des fonctionnalités standard basées sur la distance et les mots, en menant des expériences sur deux ensembles de données de référence de textes cliniques issus de tâches partagées MADE 2018 et n2c2 2018. À des fins de comparaison avec le modèle basé sur les fonctionnalités, nous utilisons des modèles de pointe et trois modèles basés sur BERT, notamment BioBERT et Clinical BERT. Nos résultats démontrent que la distance et les caractéristiques des mots offrent des avantages significatifs au classifieur. Les fonctions basées sur les connaissances améliorent les résultats de classification uniquement pour des types particuliers de relations. La fonctionnalité d'intégration de phrases fournit la plus grande amélioration des résultats, parmi d'autres fonctionnalités explorées sur le corpus MADE. Le classificateur obtient des performances de pointe en matière d'extraction de relations cliniques avec une F-mesure de 92,6 %, améliorant la F-mesure de 3,5 % sur le corpus MADE.

    • Article de recherche

      Prédiction de la récidive à distance du cancer du sein à l'aide du traitement du langage naturel et d'un réseau neuronal convolutif guidé par les connaissances

      L'intelligence artificielle en médecine, Volume 110, 2020, Article 101977

      La récidive à distance du cancer du sein entraîne des risques élevés à vie et de faibles taux de survie à 5 ans. La prédiction précoce du cancer du sein récidivant à distance pourrait faciliter l'intervention et améliorer la qualité de vie des patientes. Dans cette étude, nous avons conçu un modèle prédictif basé sur le DSE pour estimer la probabilité récurrente à distance des patientes atteintes d'un cancer du sein. Nous avons étudié les rapports de pathologie et les notes d'évolution de 6 447 patientes qui ont reçu un diagnostic de cancer du sein au Northwestern Memorial Hospital entre 2001 et 2015. Les notes cliniques ont été mappées sur les identificateurs unifiés Concept (CUI) à l'aide d'outils de traitement du langage naturel. Des sacs de mots et une intégration pré-formée ont été utilisés pour vectoriser les mots et les séquences CUI. Ces caractéristiques intégrées aux caractéristiques cliniques des données structurées ont été transmises en aval aux classificateurs d'apprentissage automatique conventionnels et au réseau neuronal convolutif guidé par les connaissances (K-CNN). La meilleure configuration de notre modèle a donné une AUC de 0,888 et un score F1 de 0,5. Notre travail fournit une méthode automatisée pour prédire la récidive à distance du cancer du sein à l'aide d'approches de traitement du langage naturel et d'apprentissage en profondeur. Nous nous attendons à ce que grâce à une ingénierie avancée des fonctionnalités, de meilleures performances prédictives puissent être obtenues.

    • Article de recherche

      DI++ : un système d'apprentissage en profondeur pour l'identification de l'état du patient dans les notes cliniques

      Intelligence Artificielle en Médecine, Volume 123, 2022, Article 102224

      L'enregistrement précis des conditions médicales d'un patient dans un système de DSE est la base d'une documentation efficace de l'état de santé du patient, du codage pour la facturation et du soutien à la prise de décision clinique basée sur les données. Cependant, les conditions des patients ne sont souvent pas entièrement saisies dans les systèmes de DSE structurés, mais peuvent être documentées dans des notes cliniques non structurées. Le défi est que toutes les mentions de maladies dans les notes cliniques ne font pas réellement référence aux conditions d'un patient. Nous avons développé un flux de travail en deux étapes pour identifier les conditions du patient à partir des notes cliniques : extraction de la mention de la maladie et classification de la mention de la maladie. Nous avons mis en œuvre ce flux de travail dans un système prototype, DI++, pour l'identification des maladies. Un modèle avancé d'apprentissage en profondeur, le modèle CLSTM-Attention, est développé pour la classification des mentions de maladies dans DI++. Une évaluation empirique approfondie sur environ un million de pages de notes cliniques anonymisées démontre que DI++ présente un avantage significatif en termes de performances par rapport aux systèmes existants sur le score F1, les mesures de l'aire sous la courbe et l'efficacité. Le modèle CLSTM-Attention proposé surpasse les modèles d'apprentissage en profondeur existants pour la classification des mentions de maladies.

    • Article de recherche

      Identification des conversations sur les objectifs de soins dans le dossier de santé électronique à l'aide du traitement du langage naturel et de l'apprentissage automatique

      Journal of Pain and Symptom Management, Volume 61, Numéro 1, 2021, pp. 136-142.e2

      Les discussions sur les objectifs de soins sont une mesure importante de la qualité des soins palliatifs. Cependant, les discussions sur les objectifs de soins sont souvent documentées sous forme de texte libre dans divers endroits. Il est difficile d'identifier efficacement ces discussions dans le dossier de santé électronique (DSE).

      Développer, former et tester une approche automatisée pour identifier les discussions sur les objectifs de soins dans le DSE, en utilisant le traitement du langage naturel (PNL) et l'apprentissage automatique (ML).

      À partir des dossiers de santé électroniques d'un système de santé universitaire, nous avons recueilli un échantillon raisonné de 3183 notes de DSE (1435 notes de patients hospitalisés et 1748 notes de patients externes) de 1426 patients atteints d'une maladie grave entre 2008 et 2016, et avons examiné manuellement chaque note pour documenter les objectifs. discussions de soins. Séparément, nous avons développé un programme pour identifier les notes contenant la documentation des discussions sur les objectifs de soins à l'aide de la PNL et du ML supervisé. Nous avons estimé les caractéristiques de performance du programme NLP/ML sur 100 paires d'ensembles d'entraînement et de test partitionnés de manière aléatoire. Nous avons répété ces méthodes pour les sous-ensembles de patients hospitalisés uniquement et ambulatoires uniquement.

      Sur 3183 notes, 689 contenaient de la documentation sur les discussions sur les objectifs de soins. La sensibilité moyenne du programme NLP/ML était de 82,3 % (ET 3,2 %) et la spécificité moyenne était de 97,4 % (ET 0,7 %). Les résultats PNL/ML avaient un rapport de vraisemblance positif médian de 32,2 (IQR 27,5–39,2) et un rapport de vraisemblance négatif médian de 0,18 (IQR 0,16–0,20). Les performances étaient meilleures dans les échantillons de patients hospitalisés que dans les échantillons de patients ambulatoires uniquement.

      À l'aide de techniques de PNL et de ML, nous avons développé une nouvelle approche pour identifier les discussions sur les objectifs de soins dans le DSE. La PNL et le ML représentent une approche potentielle pour mesurer les discussions sur les objectifs de soins en tant que résultat de la recherche et mesure de la qualité.

    Afficher le texte intégral

    © 2021 Elsevier B.V. Tous droits réservés.

    References

    Top Articles
    Latest Posts
    Article information

    Author: Maia Crooks Jr

    Last Updated: 07/22/2023

    Views: 5591

    Rating: 4.2 / 5 (63 voted)

    Reviews: 86% of readers found this page helpful

    Author information

    Name: Maia Crooks Jr

    Birthday: 1997-09-21

    Address: 93119 Joseph Street, Peggyfurt, NC 11582

    Phone: +2983088926881

    Job: Principal Design Liaison

    Hobby: Web surfing, Skiing, role-playing games, Sketching, Polo, Sewing, Genealogy

    Introduction: My name is Maia Crooks Jr, I am a homely, joyous, shiny, successful, hilarious, thoughtful, joyous person who loves writing and wants to share my knowledge and understanding with you.