MAMO.CZ | MAMOGRAFICKÝ SCREENING [ISSN 1804-0861]
česky | english | mapa webu

Datový audit

Datový audit (tj. sběr a statistické zpracování dat) mamografického screeningu v ČR je zajišťován nezávislou institucí, a to Institutem biostatistiky a analýz Masarykovy univerzity.

Charakteristika a datová struktura databáze

Centrálním úložištěm dat screeningového programu v České republice je databáze provozovaná v relačně databázovém systému Oracle 9i. Tento systém umožňuje rychlou a efektivní správu dat. Veškerá data jsou zálohována a přístup k databázi je omezen na autorizované osoby. Změny v obsahu databáze jsou protokolovány, k dispozici je tedy úplný popis takových operací, zejména importů záznamů jednotlivých center.

V databázi jsou v několika tabulkách uloženy základní informace o vyšetřených ženách, provedených screeningových i diagnostických vyšetřeních zobrazovacími metodami. Databáze rovněž obsahuje údaje o nalezených ložiscích a zkouškách stálosti mamografu. Další tabulky obsahují informace o smazaných a modifikovaných záznamech a dočasná data pro využití při importu. Nákres datového modelu centrální databáze je na Obrázku 1. Podrobný popis jednotlivých polí je specifikován v datovém rozhraní centrální databáze (ke stažení zde).

Obrázek 1: Datový model centrální databáze mamografického screeningu.

Sběr dat

Sběr dat mamografického screeningu probíhá dvoukolovým způsobem. Na jaře každého roku, obvykle v květnu, jsou z center sbírána kompletní data včetně dat za předcházející rok. Po jejich doručení na IBA jsou data kontrolována z hlediska integrity a poté jsou importovány do centrální databáze.

Následuje kontrola logiky v datech. Ta je realizována prostřednictvím souboru algoritmů, které se nazývají validační pravidla. Výsledkem aplikace validačních pravidel jsou seznamy nesrovnalostí v podobě tzv. validačních reportů. Ty jsou posléze doručeny všem centrům.

Validační reporty obsahují kromě základní sumarizace importovaných dat seznamy veškerých nalezených nesrovnalostí seskupených podle jednotlivých pravidel. Každá potenciální chyba je v reportu popsána tak, aby ji bylo možné v primárních datech na centru opravit, případně ji přímo do reportu nebo prostřednictvím softwarového nástroje vysvětlit.

Druhé kolo sběru probíhá na podzim (obvykle na konci září). Data, která centra odesílají, by tak již měla obsahovat opravená data za předcházející rok. Validační proces umožňuje využít pro následující analýzy maximálně správné údaje.

Průběžná kontrola kvality dat

Pro kvalitní statistické zpracování dat mamografického screeningu je nezbytným předpokladem vysoká kvalita zdrojových dat. Databázové řešení umožňuje pečlivou kontrolu integrity dat, která jsou importována z jednotlivých databází screeningových center, a vícefázový proces znemožňuje přidání nekorektních záznamů do centrální databáze.

Zároveň je jako úvodní součást statistických analýz implementována kontrola logiky dat, která jsou použita pro analýzy. V případě nálezu nekorektních záznamů v klíčových parametrech dochází k doplňování seznamu validačních pravidel, aby mohly být v budoucnu tyto analýzy korektně realizovány. Smysl validace dat je v tom, aby malý počet snadno opravitelných chyb neznehodnocoval nezanedbatelné množství práce při pečlivém zadávání dat do informačních systémů. Pouze validovaná data s omezeným množstvím chyb je pak při statistické analýze možné optimálně vytěžit.

Související stránky

 

Poslední aktualizace: 20. 8. 2014