MAMO.CZ | MAMOGRAFICKÝ SCREENING [ISSN 1804-0861]
česky | english | mapa webu

Ověřené výstupy

Datový audit (tj. sběr a statistické zpracování dat) mamografického screeningu v ČR je zajišťován nezávislou institucí, a to Institutem biostatistiky a analýz Lékařské fakulty Masarykovy univerzity.

Charakteristika a datová struktura databáze

Centrálním úložištěm dat screeningového programu v České republice je databáze provozovaná v relačně databázovém systému PostgreSQL. Tento systém umožňuje rychlou a efektivní správu dat. Veškerá data jsou zálohována a přístup k databázi je omezen na autorizované osoby. Změny v obsahu databáze jsou protokolovány, k dispozici je tedy úplný popis takových operací, zejména importů záznamů jednotlivých center.

V databázi jsou v několika tabulkách uloženy základní informace o vyšetřených ženách, provedených screeningových i diagnostických vyšetřeních zobrazovacími metodami. Databáze rovněž obsahuje údaje o nalezených ložiscích. Databáze dále obsahuje informace o smazaných a modifikovaných záznamech a dočasná data pro využití při importu. Nákres datového modelu centrální databáze je na Obrázku 1. Podrobný popis jednotlivých polí je specifikován v datovém rozhraní centrální databáze (ke stažení zde).

Obrázek 1: Datový model centrální databáze mamografického screeningu.

Sběr dat

Sběr dat mamografického screeningu probíhá dvoukolovým způsobem. Do konce března každého roku jsou z center sbírána data za předcházející rok. Po jejich doručení na IBA jsou data kontrolována z hlediska integrity a poté jsou importována do centrální databáze.

Následuje kontrola logiky v datech. Ta je realizována prostřednictvím souboru algoritmů, které se nazývají validační pravidla. Výsledkem aplikace validačních pravidel jsou seznamy nesrovnalostí v podobě tzv. validačních reportů. Ty jsou posléze doručeny všem centrům.

Validační reporty obsahují kromě základní sumarizace importovaných dat seznamy veškerých nalezených nesrovnalostí seskupených podle jednotlivých pravidel. Každá potenciální chyba je v reportu popsána tak, aby ji bylo možné v primárních datech na centru opravit, případně ji přímo do reportu nebo prostřednictvím softwarového nástroje vysvětlit.

Druhé kolo sběru probíhá do konce června. Data, která centra odesílají, by tak již měla obsahovat opravená data za předcházející rok. Validační proces umožňuje využít pro následující analýzy maximálně správné údaje.

Způsob zasílání dat

Data pro centrální zpracování je možné zasílat pouze elektronickou cestou v předepsaném rozhraní. Aplikace MaSc je přímo vybavena funkcí pro zabezpečené odeslání dat (funkce Nástroje => Export dat, případně tlačítko E na hlavní obrazovce). Pro jiná softwarová řešení je dostupná zdarma aplikace FTPMamo (viz Technické řešení, sekce STÁHNĚTE SI), která zajišťuje bezpečný přenos datových souborů exportovaných z ambulantních či nemocničních systémů třetích stran. Exportovaná data musí obsahovat minimálně dvouletou historii vyšetření, například při odeslání v březnu 2019 musí soubor obsahovat data minimálně od 1. 1. 2017. Soubor by měl obsahovat i data doplňujících vyšetření včetně biopsií a histologií provedených v aktuálním roce, pokud se váží ke screeningové mamografii provedené v hodnoceném období (v přechozím roce).

Průběžná kontrola kvality dat

Pro kvalitní statistické zpracování dat mamografického screeningu je nezbytným předpokladem vysoká kvalita zdrojových dat. Databázové řešení umožňuje pečlivou kontrolu integrity dat, která jsou importována z jednotlivých databází screeningových center, a vícefázový proces znemožňuje přidání nekorektních záznamů do centrální databáze.

Zároveň je jako úvodní součást statistických analýz implementována kontrola logiky dat, která jsou použita pro analýzy. V případě nálezu nekorektních záznamů v klíčových parametrech dochází k doplňování seznamu validačních pravidel, aby mohly být v budoucnu tyto analýzy korektně realizovány. Smysl validace dat je v tom, aby malý počet snadno opravitelných chyb neznehodnocoval nezanedbatelné množství práce při pečlivém zadávání dat do informačních systémů. Pouze validovaná data s omezeným množstvím chyb je pak při statistické analýze možné optimálně vytěžit.

Související stránky

 

Poslední aktualizace: 12. 3. 2019