药物临床试验机构百问百答-70(安控新能)
临床试验统计原则
6 安全性与耐受性评价
6.1 评价的范围
在所有临床试验中,安全性和耐受性(见词汇表)的评价是一个重要方面。在早期阶段,这种评价主要是探索性的,并且只对毒性的直接表达敏感,而在后期阶段,可在更大样本量的受试者中更加全面地描述药物的安全性和耐受性特征。后期阶段的对照试验代表了以无偏的方式探索任何新的潜在不良反应的重要方法,即使这些试验在这方面通常缺乏检验效能。
某些试验可针对以安全性和耐受性的优效性或等效性(与其它药物或与研究药物的其它剂量相比)的特定主张为目的进行设计。这些特定主张需得到来自确证性试验的相关证据支持,就像相应的有效性主张需要证据支持一样。
6.2 指标选择与数据收集
在任何临床试验中,选择用于评价药物安全性和耐受性的方法和测量取决于许多因素,包括对与药物密切相关的不良反应的了解,来自非临床和早期临床研究的信息以及特定药物的药效/药代动力学特性的可能结果、给药方式、待研究的受试者类型,以及试验持续时间。有关临床化学和血液学、生命体征、临床不良事件(疾病、体征和症状)的实验室检查通常构成安全性和耐受性数据的主体。发生严重不良事件以及因不良事件导致治疗终止对于注册是特别重要的(见ICH E2A和 ICH E3)。
此外,建议在整个临床试验规划中采用一致的方法来收集和评价数据,以便合并来自不同试验的数据。使用通用的不良事件词典尤为重要。该词典具有一种结构,提供了在三个不同层级上汇总不良事件数据的可能性,即系统-器官分类、首选术语和收录术语(见词汇表)。首选术语通常是汇总不良事件的层级,在数据的描述性展示中,可以汇集属于同一系统-器官分类的首选术语(见 ICH M1)。
6.3 待评价受试者集及数据展示
对于整体安全性和耐受性评价,待汇总的受试者集通常被定义为那些接受至少一个剂量研究药物的受试者。应尽可能全面地从这些受试者中收集安全性和耐受性指标,包括不良事件类型、严重程度、发病和持续时间(见 ICH E2B)。可能需要在特定的亚组人群,如女性、老年人(见 ICH E7)、严重疾病或那些有常见伴随治疗的人群,进行额外的安全性及耐受性评价。这些评价可能需要解决更加特殊的问题(见ICH E3)。
在评价过程中需要注意所有安全性和耐受性指标,并且在方案中应阐明方法。所有不良事件都应报告,无论它们是否被认为与治疗有关。在评价中应当考虑研究人群中的所有可用数据。应当谨慎地定义测量值的单位和实验室指标的参考范围,如果在同一试验中出现不同的单位或不同的参考范围(例如涉及一个以上的实验室),则测量值应当被适当标准化,以便统一评价。应预先确定毒性分级量表的使用,并说明合理性。
某种不良事件的发生率通常以经历事件的受试者数量与处于风险中的受试者数量之比来表示。然而,如何评价发生率并不总是显而易见的,例如,根据情况可考虑把暴露的受试者数量或暴露程度(用人年表示)作为分母。无论计算的目的是估计风险还是在处理组之间进行比较,重要的是要在方案中给出定义。如果计划进行长周期治疗,并预期有相当比例的退出治疗或死亡,这一点尤其重要。对于这些情况,应考虑生存分析方法,并计算累积不良事件率,以避免低估的危险。
对于存在大量体征和症状的背景噪声的情况(如精神病试验), 在估计不同不良事件的风险时, 应考虑对此进行解释的方法。一种方法是利用“治疗引发事件”(见词汇表)的概念,即只有当不良事件出现或相对于治疗前基线发生恶化时,才记录它们。
减少背景噪声影响的其他方法也许是合适的,如忽略轻度不良事件,或再次随访时观察到的事件才可计入分子。这些方法应在方案中解释并说明其合理性。
6.4 统计评价
安全性与耐受性的研究是一个多维问题。对于任何药物,虽然通常可以预见和监测到某些特定不良反应,但由于可能的不良反应范围非常大,新的和不可预见的反应总可能出现。
此外,在违背方案之后经历的不良事件可能引入偏倚,如使用违禁药物。这个背景使药物安全性和耐受性的统计分析和评价变得困难,并且意味着来自确证性临床试验的结论性信息是一种例外而不是通例。
大多数试验中,应用数据的统计描述方法,辅以有助于解释的置信区间计算,是说明安全性和耐受性的最好方法。
利用图示方法表达处理组间和受试者间不良事件的模式也有价值。
计算P值有时是有意义的,无论作为评价有关特定差异的辅助手段,还是作为“标记”符号以引起对大量安全性与耐受性指标所出现差异的进一步关注。这对于实验室数据尤其有用,否则可能难以适当地进行汇总。建议对实验室数据既要进行定量分析,如对处理组均数的评价,又要进行定性分析,如计算高于或低于某些阈值的比例。
如果使用假设检验,对多重性的统计调整以量化 I 类错误是合适的,但是 II类错误通常更值得关注。如果未做多重性调整,应谨慎解释常规的统计显著性。
大多数试验中,与阳性对照药物或安慰剂相比,研究者会试图确定未出现临床上不可接受的安全性及耐受性方面的差异。与有效性的非劣性或等效性评价一样,这种情况下使用置信区间比假设检验更可取,因为置信区间往往可以清楚地显示由低发生率所引起的精度变差。
6.5 综合性总结
在研究产品的开发过程中,特别是在上市申请时,通常会将不同试验的药物安全性与耐受性的特性进行汇总。然而,这样汇总是否可用取决于每一个具有高数据质量的、充分和控制良好的试验。
药物的总体可用性始终是风险与获益之间的平衡问题,单个试验中也可考虑这一观点,即使风险/获益评估通常在整个临床试验的总结阶段进行。(见第 7.2.2章节)有关安全性与耐受性报告的更多细节,见 ICH E3第 12章。