Курирование данных
Data Curation
Курирование исходных данных для целей статистического анализа конкретных клинических исследуемых вопросов. Курирование данных включает следующие аспекты, но не ограничивается ими: извлечение данных (в том числе из нескольких источников данных), обработку для обеспечения безопасности данных (деидентификация или анонимизация, защита от повреждения, утечки, кражи, фальсификации или несанкционированного доступа), очистку данных (проверка редактирования и обработка выбросов, обработка полноты данных), преобразование данных (общие модели данных, нормализация, обработка на естественном языке, медицинское кодирование, расчет производных переменных), контроль качества данных, передача и хранение данных
The curation of the source data for the purpose of statistical analysis of specific clinical research questions. Data curation includes, but is not limited to, the following aspects: data extraction (including multiple data sources), data security processing (de-identification or anonymization, and protection from data corruption, leaking, theft, tampering, or unauthorized access), data cleaning (edit check and outliers processing, data completeness processing), data conversion (common data models, normalization, natural language processing, medical coding, derived variable calculation), data quality control, data transmission and storage