文章快速检索     高级检索
   中国临床医学  2023, Vol. 30 Issue (5): 851-856      DOI: 10.12025/j.issn.1008-6358.2023.20230543
0
早期临床试验设计与分析方法比较
袁楠 , 林晓蕾     
复旦大学大数据学院, 上海 200433
摘要目的: 探讨6种经典与创新型早期临床试验设计与分析方法在多种剂量-疗效关系情境中的应用效果。方法: 结合临床经验,设计4种剂量水平下4种情境的剂量-毒性曲线(单调递增)和剂量-疗效曲线(单调递增和非单调递增)。使用R软件进行数值模拟分析,比较EffTox设计、STEIN设计、UBOIN设计、TEPI设计、PRINTE设计和Ji3+3设计在不同情境下的安全性和效用性指标,并在实际数据集上进行检验。结果: 在4种单调递增和4种非单调递增的剂量-疗效关系下,STEIN均具有良好的安全性和效用性;EffTox效用性指标的稳定性较差,在不同的剂量-疗效关系中稳定性更差;TEPI需要牺牲更多的毒性剂量患者数、最佳生物学剂量(optimal biological dose, OBD)准确性以及OBD患者占比才能达到PRINTE的毒性剂量选择占比和OBD准确性;Ji3+3的性能趋势和效果与PRINTE相似;UBOIN的效用性略差于PRINTE和Ji3+3。结论: STEIN适用于多种剂量-疗效关系,效果良好且稳定;不建议在非单调剂量-疗效关系中使用EffTox;PRINTE具有比TEPI更好的安全性和效用性;当试验对毒性剂量患者数有较高要求时,可优先考虑使用UBOIN。
关键词早期临床试验    最佳生物剂量    STEIN设计    PRINTE设计    UBOIN设计    
Comprehensive comparisons of novel statistical designs for early phase clinical trials
YUAN Nan , LIN Xiao-lei     
School of Data Science, Fudan University, Shanghai 200433, China
Abstract: Objective: To explore the application effectiveness of multiple classic and innovative early-stage clinical trial design and analysis methods in various dose-response scenarios. Methods: Combined with clinical experience, the dosetoxicity curve (monotonously increasing) and dose-efficacy curve (monotonously increasing and non-monotonously increasing) were designed for 4 scenarios at 4 dose levels. The R software was used to perform numerical simulation analysis, and the safety and efficacy measures of EffTox, STEIN, UBOIN, TEPI, PRINTE and Ji3+3 were compared under different scenarios and tested on the actual data set. Results: STEIN had good safety and efficacy, and it was very robust in multiple dose-efficacy scenarios; the efficacy of EffTox measures were less robust, especially for different dose-efficacy scenarios; TEPI required sacrificing more toxic dose patients and greater proportion of optimal biological dose (OBD) patients to proportion of toxic dose selection and OBD accuracy of PRINTE. The performance trend and effect of Ji3+3 were similar to those of PRINTE; UBOIN was slightly less effective than PRINTE and Ji3+3. Conclusions: STEIN is suitable for a variety of dose-efficacy scenarios, with good and stable results; it is not recommended to use EffTox in non-monotonously increasing dose-efficacy scenarios; PRINTE has better safety and efficacy than TEPI; UBOIN may be preferred in a trial expected lower number of patients with toxic doses.
Key words: early phase clinical trial    optimal biological dose    STEIN    PRINTE    UBOIN    

临床试验是评估药物、疫苗及医疗器械等干预手段安全性和有效性的金标准,也是药品和器械等新技术上市前的必要环节[1-5]。早期临床试验通常涉及小样本量患者或健康受试者,主要用于评估药物的安全性和耐受性,并探讨药物最大耐受剂量(maximum tolerated dose, MTD),从而指导后期大规模临床研究。药物最优剂量的确定需要综合考虑药物的药理学特性、药代动力学及给药方式等多种因素[6-8]

传统小分子药物的Ⅰ期临床试验通常假设药物的毒性和有效性均随剂量的增加而升高,即“单调剂量反应”假设,例如3+3[9]、i3+3[10]、TPI[11]及CRM[12]等经典试验设计方法。然而,在大分子药物试验和细胞靶向疗法中,受体和配体的结合易受到药物浓度的影响而发生饱和甚至下降,此时“单调剂量反应”假设通常不成立[13-15]。因此,针对大分子药物和细胞靶向疗法的Ⅰ、Ⅱ期试验不再以确定MTD为目的,而主要探讨可以平衡毒性和有效性的最佳生物学剂量(optimal biological dose, OBD)。

目前,Ⅰ、Ⅱ期临床试验中广泛使用的创新型设计方法包括EffTox[16]、STEIN[17]、UBOIN[18]、TEPI[19]、PRINTE[20]和Ji3+3[21]。本文比较分析6种试验设计方法在不同临床情境下的统计学表现(安全性和效用性),旨在为参与临床试验的科研医务工作者提供参考。

1 试验设计与方法 1.1 试验设计 1.1.1 EffTox[16]设计

EffTox设计将不同剂量水平下受试者人数的后验期望转化为点与点间的距离。“距离”由药物剂量的毒性概率和疗效概率、目标毒性概率-疗效概率曲线以及理想状态下的疗效和毒性所决定。模型中目标毒性概率-疗效概率曲线由3个坐标表示。OBD定义为后验期望取值最大时的药物剂量。

1.1.2 STEIN[17]设计

STEIN设计根据给定的毒性和疗效概率区间截断值,通过最小化错分概率计算毒性和疗效概率的可接受区间,进而推断最优剂量。OBD定义为毒性和疗效概率的效用函数达到最大值时的药物剂量。

1.1.3 UBOIN[18]设计

UBOIN设计是1个两阶段模型。第1阶段,依据目标可耐受剂量确定毒性概率的阈值,并依据此阈值确定下一剂量水平至患者数量超过默认值。第2阶段,从可接受剂量中选择效用函数值最大的剂量作为下一组患者的剂量,重复上述步骤直至患者数量超过默认值或最大样本量。选择平均效用函数估计值最大的剂量作为OBD。

1.1.4 TEPI[19]设计

TEPI设计假设毒性和疗效概率的先验分布服从β分布,寻找毒性和疗效概率区间联合单位概率质量最大的区间间隔,并基于预先设定的决策表选择下一组患者的最优剂量,重复此步骤直至最大样本量。OBD定义为效用函数后验期望取值最大时的药物剂量。

1.1.5 PRINTE[20]设计

PRINTE设计根据奥卡姆剃刀(Ockham’s razor)原理对TEPI的等效区间进行更精细划分,并基于这些子区间的边际后验概率确认下一组患者的最优剂量。在筛选OBD方面,PRINTE通过过滤效用函数来避免选择效用值过低的剂量为OBD。

1.1.6 Ji3+3[21]设计

Ji3+3设计是一种基于决策规则的OBD选择方法,通过计算目前剂量的毒性概率和疗效概率,并根据决策规则计算概率区间,若疗效证据足够则维持目前剂量,反之则增加剂量。OBD的选取采取与PRINTE相似的效用函数和筛选方法。

1.2 临床试验情境设置

基于临床试验常见的4个剂量水平,在每个剂量水平下设置4种单调递增的剂量-毒性关系、4种单调递增的剂量-疗效关系和4种非单调递增的剂量-疗效关系情境(图 1)。依据临床经验,试验总样本量设置为27人,每次入组队列设置为3人。

图 1 临床试验毒性与疗效概率的情境设置
1.3 试验表现评估指标

采用4个指标评估不同试验设计筛选OBD的统计学表现:(1)毒性剂量患者数,表示接受毒性大于MTD剂量治疗的患者例数;(2)毒性剂量选择占比,表示选择毒性高于MTD剂量的患者占比;(3)OBD患者占比,表示接受OBD治疗的患者占比;(4)OBD准确性,表示OBD被准确选择出来的患者占比。前2项为安全性指标,后2项为效用性指标。

1.4 真实数据集验证

采用Montanide ISA 720 VG和Nor-MDP佐剂的2种嵌合HER-2 B细胞肽乳化疫苗(这2种疫苗被设计为代表trastuzumab和pertuzumab结合位点)用于晚期实体瘤患者的Ⅰ期免疫治疗试验的临床数据[22],进行结果验证。由该临床试验的结果可知,该疫苗耐受性良好,剂量水平2为推荐的Ⅱ期剂量,且未观察到严重不良反应或剂量限制毒性。因此,根据既往文献[23],设置不同剂量水平下真实的疗效概率(0.01、0.61、0.57、0.14)和毒性概率(0.1、0.12、0.13、0.15)。

1.5 统计学处理

采用R 4.1.2软件进行统计学分析。采用“ trialr”包对EffTox设计每个试验情境模拟100次;对STEIN设计每个试验情境模拟5 000次,每种情境下毒性和疗效数据均匀分布随机生成。采用“nimble”和“BOIN”宏包对UBOIN设计每个试验情境模拟1 000次,每种情境下的毒性和疗效数据依据多项式分布方法随机生成;TEPI设计、PRINTE设计和Ji3+3设计每个试验情境模拟1 000次,每种情境下毒性和疗效数据从独立的二项式分布中随机产生。为了确保效用函数的一致性,STEIN采用与TEPI相同的效用函数。

2 结果 2.1 安全性指标

结果(图 2)显示:当毒性和疗效随剂量增加而快速升高时,所有试验设计方法均显示出较差的安全性。当疗效不随剂量增加而升高时,TEPI的毒性剂量患者数最多,安全性最差,其余5种方法安全性较好。无论剂量-疗效呈单调递增还是非单调递增,STEIN的毒性剂量患者数和毒性剂量选择占比均较低,安全性较好;TEPI和EffTox更倾向于将较多患者暴露于非安全剂量;Ji3+3和PRINTE具有相似的且优于EffTox的安全性表现。

图 2 不同临床试验情境下6种试验设计的安全性指标比较 A、B:毒性剂量患者数;C、D:毒性剂量选择占比。红色越深表示安全性越差。
2.2 效用性指标

结果(图 3)显示,当疗效随剂量增加而单调递增时,6种设计方法在不同情境下的表现变化趋势相似:当疗效情境为情境4时,6种设计方法均有最高的OBD准确性和OBD患者占比;而在毒性情境4,6种设计方法均有最差的OBD准确性和OBD患者占比。在所有疗效随剂量升高而增加的情境下,STEIN的效用性指标最佳,其次是UBOIN,TEPI的效用性指标最差。当剂量-疗效非单调递增时,STEIN的OBD准确性和OBD患者占比最高,EffTox和TEPI在疗效不随剂量变化而变化的情境(情境4)下表现最差,Ji3+3、PRINTE和UBOIN在疗效不随剂量变化而变化的情境(情境4)下表现也较差。

图 3 不同临床试验情境下6种试验设计的效用性指标比较 A、B:OBD准确性;C、D:OBD患者占比。紫色越深表示效用性越高。OBD:最佳生物学剂量。
2.3 剂量水平的影响

为了比较不同试验设计的综合表现及其是否依赖于试验的总剂量水平,本研究在5剂量水平的情境下重复了数值模拟实验。结果显示,随着剂量水平的增加,6种试验设计方法的安全性均得以提高,且TEPI受剂量水平变化的影响最大。6种试验设计方法在5剂量水平下的效用性指标变化趋势与4剂量水平时相似,且随着剂量水平的增加,EffTox的效用性指标表现改善,其余5种方法略降低,但变化不明显。表 1为不同剂量水平下安全性和效用性指标表现最优的设计方法。

表 1 不同剂量水平和疗效情境下安全性、效用性指标最优表现的设计方法
剂量水平 剂量-疗效 毒性剂量患者数 毒性剂量选择占比 OBD准确性 OBD患者占比
4 单调递增 STEIN STEIN STEIN STEIN
非单调递增 STEIN STEIN STEIN STEIN
5 单调递增 STEIN STEIN EffTox EffTox
非单调递增 STEIN STEIN STEIN STEIN
2.4 真实数据集验证

(1) 试验中未观察到严重不良反应或剂量限制毒性,6种试验设计的毒性剂量患者数和毒性剂量选择占比均为0;(2)效用性指标,结果(表 2)显示:STEIN的OBD准确性达90%,OBD患者占比高于其余5种试验设计;EffTox的OBD准确性和OBD患者占比均较低,约20%;Ji3+3、TEPI和PRINTE的OBD准确性接近;TEPI的OBD患者占比低于Ji3+3和PRINTE;UBOIN的OBD准确性仅高于EffTox,OBD患者占比略高于TEPI。

表 2 6种试验设计在真实数据集中的效用性指标结果 
%
效用性指标 EffTox Ji3+3 PRINTE TEPI UBOIN STEIN
OBD准确性 17 69 74 60 50 90
OBD患者占比 25 58 62 22 45 79
3 讨论

在疾病治疗方案的选择及新药研发中,药物最优剂量选取通常是第1步,也是决定大型临床试验能否成功的重要环节。早期临床试验通过在较少的受试者群体中探索药物的安全性、耐受性以及初步疗效,通过合理的试验设计和数据分析,选择适用于后续临床试验的OBD。本文通过设置多种临床试验情境,比较6种经典或创新型早期临床试验设计方法的安全性与效用性,并用实际数据进行验证。

本研究结果显示,不论疗效是否随剂量增加而单调递增,STEIN均表现出较好的安全性和效用性。当剂量-疗效曲线非单调变化且其他设计方法表现不佳时,STEIN仍较为稳定。EffTox的性能表现在不同试验情境下差异较大,当疗效随剂量增加而升高时,其效用指标表现良好;但当疗效与剂量非单调递增时,其效用性较差。因此,不建议在非单调剂量-疗效情境下使用EffTox。尽管TEPI和PRINTE的设计思想均基于概率区间,但这2种方法的安全性与效用性存在一定差异:无论剂量-疗效情境是否单调,TEPI都需要牺牲更高的OBD患者占比才能达到PRINTE的OBD准确性,同时需要牺牲更多的毒性剂量患者数,以达到PRINTE毒性剂量选择占比。这可能是由于PRINTE设计中的区间划分更为精细。基于规则Ji3+3模型的安全性和效用性均与PRINTE相似。

综上所述,在各种情境下,STEIN均表现出较好的安全性和效用性,而Ji3+3模型规则简单易懂,且统计学表现良好,可作为首选。UBOIN因指定“分数”映射计算每个试验情境的效用函数,故具有一定的局限性,且OBD准确性和OBD患者占比表现略差于PRINTE和Ji3+3,特别是在5剂量水平情况下,此劣势更为明显。

利益冲突:所有作者声明不存在利益冲突。

参考文献
[1]
石伟, 纪宝华. 临床试验的重要性(综述)[J]. 中国医学科学院学报, 1987, 9(4): 313-316.
SHI W, JI B H. The importance of clinical trials (a review)[J]. Acta Acad Med Sin, 1987, 9(4): 313-316.
[2]
李瑶. 临床试验地位日渐凸显[N]. 医药经济报, 2010-07-12(2).
LI Y. The status of clinical trials is becoming more and more prominent[N]. Med Econ News, 2010-07-12(2).
[3]
AKHONDZADEH S. The importance of clinical trials in drug development[J]. Avicenna J Med Biotechnol, 2016, 8(4): 151.
[4]
黎泽琳, 杨建红, 董江萍. 我国开展进口预防性疫苗国际多中心临床试验的必要性[J]. 中国新药杂志, 2021, 30(21): 1928-1933.
LI Z L, YANG J H, DONG J P. The necessity of international multicenter clinical trials of imported preventive vaccines in China[J]. Chin J New Drugs, 2021, 30(21): 1928-1933. [CNKI]
[5]
LANG T, SIRIBADDANA S. Clinical trials have gone global: is this a good thing?[J]. PLoS Med, 2012, 9(6): e1001228. [DOI]
[6]
MATHIJSSEN R H J, SPARREBOOM A, VERWEIJ J. Determining the optimal dose in the development of anticancer agents[J]. Nat Rev Clin Oncol, 2014, 11(5): 272-281. [DOI]
[7]
HASSANZADEH P, ATYABI F, DINARVAND R. The significance of artificial intelligence in drug delivery system design[J]. Adv Drug Deliv Rev, 2019, 151-152: 169-190. [DOI]
[8]
HOLFORD N H, SHEINER L B. Kinetics of pharmacologic response[J]. Pharmacol Ther, 1982, 16(2): 143-166. [DOI]
[9]
STORER B E. Design and analysis of phase Ⅰ clinical trials[J]. Biometrics, 1989, 45(3): 925-937. [DOI]
[10]
LIU M Z, WANG S J, JI Y. The i3+3 design for phaseⅠclinical trials[J]. J Biopharm Stat, 2020, 30(2): 294-304. [DOI]
[11]
JI Y, LI Y S, NEBIYOU BEKELE B. Dose-finding in phase Ⅰ clinical trials based on toxicity probability intervals[J]. Clin Trials, 2007, 4(3): 235-244. [DOI]
[12]
O'QUIGLEY J, PEPE M, FISHER L. Continual reassessment method: a practical design for phase 1 clinical trials in cancer[J]. Biometrics, 1990, 46(1): 33-48. [DOI]
[13]
MORRISSEY K M, YURASZECK T M, LI C C, et al. Immunotherapy and novel combinations in oncology: current landscape, challenges, and opportunities[J]. Clin Transl Sci, 2016, 9(2): 89-104. [DOI]
[14]
POTTIER C, FRESNAIS M, GILON M, et al. Tyrosine kinase inhibitors in cancer: breakthrough and challenges of targeted therapy[J]. Cancers (Basel), 2020, 12(3): 731. [DOI]
[15]
ZHONG L, LI Y S, XIONG L, et al. Small molecules in targeted cancer therapy: advances, challenges, and future perspectives[J]. Signal Transduct Target Ther, 2021, 6(1): 201. [DOI]
[16]
THALL P F, COOK J D. Dose-finding based on efficacy-toxicity trade-offs[J]. Biometrics, 2004, 60(3): 684-693. [DOI]
[17]
LIN R T, YIN G S. STEIN: a simple toxicity and efficacy interval design for seamless phase Ⅰ/Ⅱ clinical trials[J]. Stat Med, 2017, 36(26): 4106-4120. [DOI]
[18]
ZHOU Y H, LEE J J, YUAN Y. A utility-based Bayesian optimal interval (U-BOIN) phaseⅠ/Ⅱ design to identify the optimal biological dose for targeted and immune therapies[J]. Stat Med, 2019, 38(28): 5299-5316.
[19]
LI D H, WHITMORE J B, GUO W T, et al. Toxicity and efficacy probability interval design for phaseⅠ adoptive cell therapy dose-finding clinical trials[J]. Clin Cancer Res, 2017, 23(1): 13-20. [DOI]
[20]
LIN X L, JI Y. Probability intervals of toxicity and efficacy design for dose-finding clinical trials in oncology[J]. Stat Methods Med Res, 2021, 30(3): 843-856. [DOI]
[21]
LIN X, JI Y. The Joint i3+3 (Ji3+3) design for phaseⅠ/Ⅱ adoptive cell therapy clinical trials[J]. J Biopharm Stat, 2020, 30(6): 993-1005. [DOI]
[22]
BEKAⅡ-SAAB T, WESOLOWSKI R, AHN D H, et al. PhaseⅠ immunotherapy trial with two chimeric HER-2 B-cell peptide vaccines emulsified in montanide ISA 720VG and nor-MDP adjuvant in patients with advanced solid tumors[J]. Clin Cancer Res, 2019, 25(12): 3495-3507. [DOI]
[23]
SHI H L, CAO J G, YUAN Y, et al. uTPI: a utility-based toxicity probability interval design for phaseⅠ/Ⅱ dose-finding trials[J]. Stat Med, 2021, 40(11): 2626-2649. [DOI]

文章信息

引用本文
袁楠, 林晓蕾. 早期临床试验设计与分析方法比较[J]. 中国临床医学, 2023, 30(5): 851-856.
YUAN Nan, LIN Xiao-lei. Comprehensive comparisons of novel statistical designs for early phase clinical trials[J]. Chinese Journal of Clinical Medicine, 2023, 30(5): 851-856.
通信作者(Corresponding authors).
林晓蕾, Tel: 021-65648878, E-mail: xiaoleilin@fudan.edu.cn.
基金项目
上海市自然科学基金面上项目(21ZR1405000)
Foundation item
Supported by the General Program of Shanghai Natural Science Foundation (21ZR1405000)

工作空间