banner
Casa / Notizia / FracAtlas: un set di dati per la classificazione, localizzazione e segmentazione delle fratture delle radiografie muscoloscheletriche
Notizia

FracAtlas: un set di dati per la classificazione, localizzazione e segmentazione delle fratture delle radiografie muscoloscheletriche

Feb 05, 2024Feb 05, 2024

Dati scientifici volume 10, numero articolo: 521 (2023) Citare questo articolo

1 Altmetrico

Dettagli sulle metriche

La radiografia digitale è uno degli standard più comuni ed economici per la diagnosi delle fratture ossee. Per tali diagnosi è necessario l'intervento di esperti che richiede molto tempo e una formazione rigorosa. Con la recente crescita degli algoritmi di visione artificiale, c’è un aumento di interesse per la diagnosi assistita da computer. Lo sviluppo di algoritmi richiede set di dati di grandi dimensioni con annotazioni adeguate. I set di dati a raggi X esistenti sono piccoli o privi di annotazioni adeguate, il che ostacola lo sviluppo di algoritmi di apprendimento automatico e la valutazione delle prestazioni relative degli algoritmi per la classificazione, localizzazione e segmentazione. Presentiamo FracAtlas, un nuovo set di dati di scansioni a raggi X curate dalle immagini raccolte da 3 importanti ospedali del Bangladesh. Il nostro set di dati include 4.083 immagini che sono state annotate manualmente per la classificazione, la localizzazione e la segmentazione delle fratture ossee con l'aiuto di 2 radiologi esperti e un ortopedico utilizzando la piattaforma di etichettatura open source makesense.ai. Ci sono 717 immagini con 922 casi di fratture. Ciascuna istanza di frattura ha la propria maschera e riquadro di delimitazione, mentre le scansioni hanno anche etichette globali per le attività di classificazione. Riteniamo che il set di dati costituirà una risorsa preziosa per i ricercatori interessati a sviluppare e valutare algoritmi di apprendimento automatico per la diagnosi delle fratture ossee.

Negli ultimi decenni si è assistito ad un aumento della domanda di sistemi di diagnosi assistita da computer (CAD). Inoltre, recentemente diversi campi della scienza medica hanno visto un rapido sviluppo di processi di automazione nella diagnosi che sfruttano grandi set di dati e algoritmi avanzati di apprendimento automatico1,2. Modelli come le reti neurali convoluzionali (CNN)3, You only look once (YOLO)4 e U-NET5 possono raggiungere prestazioni da esperti nel rilevamento di anomalie dalle scansioni a raggi X. L'addestramento di tali modelli richiede set di dati ampi e ben annotati6,7,8. È difficile raccogliere tali dati da ospedali e centri diagnostici. Il processo di annotazione può essere molto costoso in quanto richiede il coinvolgimento di più medici e radiologi per ottenere il consenso necessario a rimuovere pregiudizi ed errori umani. A causa della natura sensibile dei dati medici, è anche molto difficile rendere i dati acquisiti disponibili per uso pubblico. In sintesi, la creazione di tali set di dati è costosa e richiede molto tempo2,9.

Alcuni dei noti set di dati a raggi X disponibili al pubblico e incentrati sulle anomalie includono MURA10, MedPix11, GRAZPEDWRI-DX12, IIEST1, MOST13, VinDr-CXR2, VinDr-SpineXR14 e ChestX-ray1415. Tra questi set di dati, MURA è una raccolta di radiografie muscoloscheletriche 2D con 40.561 immagini di diverse regioni come gomito, dito, avambraccio, mano, omero, spalla e polso10. Ogni immagine è etichettata come "Normale" o "Anormale" il che la rende adatta per attività di classificazione, tuttavia manca di annotazioni adeguate per la localizzazione e la segmentazione. MedPix è un database online di scansioni mediche 2D e 3D di varie malattie che possono essere filtrate tramite la parola chiave "frattura" ottenendo 954 immagini. Queste immagini includono raggi X, immagini reali, risonanza magnetica (MRI), scansioni di tomografia computerizzata (CT) e ecografia. Tuttavia, il set di dati presenta problemi quali annotazioni non organizzate e immagini etichettate in modo errato, nonché alcune immagini spam. GRAZPEDWRI-DX è un set di dati rilasciato di recente, contenente 20.327 scansioni con annotazioni per la localizzazione raccolte da 6.091 pazienti. Sebbene si tratti di un set di dati sufficientemente ampio, copre solo le fratture del polso, omettendo il resto delle parti del corpo umano. IIEST è un piccolo set di dati di radiografie 2D contenente 217 immagini, di cui 49 sono sane, 99 sono fratturate e 69 sono scansioni ossee cancerose. Questo set di dati è molto piccolo e inadeguato per le attività di apprendimento automatico. MOST è un set di dati che contiene 4.446 scansioni radiografiche e MRI etichettate dal sistema di classificazione Kellgren–Lawrence (KL)16 con cinque classi dal grado 0 al grado 4 con gravità crescente da una a quella successiva. Questo set di dati non è più disponibile di pubblico dominio a causa della mancanza di finanziamenti e della chiusura. Copre anche solo le fratture dell'articolazione del ginocchio. VinDr-CXR è anche un set di dati pubblicato di recente, che contiene 18.000 immagini di radiografie del torace (CXR) con annotazione manuale per la localizzazione. Questo set di dati contiene campioni per 28 diversi tipi di malattie e anomalie del torace. Sebbene si tratti di un buon set di dati per identificare le malattie del torace, non è adatto per l'identificazione delle fratture ossee. Allo stesso modo, il gruppo VinDr dispone di altri set di dati VinDr-Mammo17, VinDr-SpineXR14 e PediCXR18 che non sono adatti allo studio delle fratture per ragioni simili. ChestX-ray14 è un set di dati per radiografici contenente 112.000 scansioni CXR. Inoltre, questo set di dati non è adatto per lo studio sulle fratture ossee poiché contiene solo campioni di malattie del torace. Alcuni importanti set di dati di radiografie del corpo umano sono confrontati con il set di dati FracAtlas19 nella Tabella 1.