论文摘要
研究背景FDA (Food and Drug Administration)对递交的临床数据要求遵从临床数据交换标准协会(CDISC, Clinical Data Interchange Standards Consortium)标准的研究数据表格模型(SDTM, Study Data Tabulation Model)和分析数据模型ADaM (Analysis Data Model)。CDISC提供了一整套用于临床试验的研究数据和元数据采集、交换、提交和存档的标准,包括临床数据获取协调标准(CDASH)、实验室数据模型(LAB)、操作数据模型(ODM)、研究数据表格模型(SDTM)、分析数据模型(ADaM),以及受控术语(Controlled Terminology)等。行业内已经开始逐渐应用CDISC标准:包括CDASH用以数据收集,SDTM用以数据交换和ADaM用以数据分析。应用CDISC标准,可以缩短研究时间和提高数据质量。当前,从CDASH数据,到生成SDTM和ADaM数据,还多处于手工处理阶段。自动化工具还不完善,没有成熟的商业工具。在临床试验中,如果收集的数据使用CDISC的CDASH、SDTM和ADaM后,很多东西可以重复使用:CRF的设计,数据库的设计,报表生成工具等。因此,我们可以基于CDISC标准,1)可开发相应的工具;2)尽可能使用现有的工具。研究内容、方法本研究从实际出发,以一个简单的临床研究方案入手,以此设计病例调查表(CRF),原始CDASH数据,开发配置文件和转换程序,来自动化生成SDTM数据和ADaM数据。并且,如果原始数据集不是采用的CDASH标准,而是用户自己的标准,将对其进行变量映射,预处理成CDASH标准。整个转换流程标准化,且力求通用性(变量名称,取值)强,能用于多种类型的研究。通用性:像常见的人口统计学,既往史,体格检查,不良反应,合并用药,生命体征,以及试验完成情况小结等,结构类似,都是可以标准化的,所以是通用的。以期提高递交数据的质量,减少生成数据的时间和花费。节省的时间可以用来放在设计方案和分析数据上。研究结果以常见的口腔护理领域的平均牙龈炎指数和平均牙菌斑指数为主要的有效性指标,草拟了一份临床方案。以此方案为基础,设计了病例调查表(CRF),并模拟了原始数据(包括RAW格式和CDASH格式)。对病例调查表还做了CDASH变量标注和SDTM变量标注。结合电子表格格式的配置和映射关系文件,开发了一系列的SAS宏。从CDASH转换为SDTM,和从SDTM转换到ADaM,有开发相应的配置文件和映射关系文件,用SAS程序读取这些配置文件和映射文件,将原始数据集逐步转化为SDTM和ADaM数据格式。配置文件和映射关系文件的开发,基于CDASH、SDTM和ADaM格式的特点做了需求分析,对每种变量或数据结构进行了分析。基于这些需求分析而做了映射关系文件的设计。结论临床试验中递交数据自动化生成系统将能够在短时间内,通过用户在电子表格中的设定,从原始RAW数据(CDASH/非CDASH),快速生成SDTM和ADaM数据。CDISC标准的数据格式,其变量名称固定有规律,数据结构相对固定,可读性和一致性好,方便统计分析,能够为审阅者节省时间。其设计特点:1) 以原始RAW数据(标准化的CDASH,或非CDASH标准的数据)为基础;2)自动化生成SDTM和ADaM数据;3)数据规范符合FDA的CDER部门的合规要求;4)对用户友好,微软的电子表格Excel软件人人会用,因而简单易用,对不熟悉CDISC标准的用户也能快速上手。