excitemusic

乳腺外科医が乳がんの最新情報をブログで紹介しています
by aiharatomohiko
ICELANDia
S M T W T F S
1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31
カテゴリ
以前の記事
検索
タグ
その他のジャンル
ファン
記事ランキング
ブログジャンル
画像一覧


BOLERO2から振り返るフリカケ薬の話 その3

エベロリムスがHRQOLを改善するという研究を追いかけたところ、ECCO2011の中間解析結果と2013Cancerの論文化された最終報告の結果があまりに異なっている理由が理解できなかったので、会社に問い合わせてみたところ、以下の事実がわかりました。

Q1:最終解析の論文には中間解析の事が触れられていないようです。また、二回解析をしているにもかかわらず、最終解析の論文ではαが5%と記されており、調整がなされていないようですが、何故でしょうか?

A1-1:中間解析の結果が論文にて触れられていないというご指摘について。

ご指摘の通りで、Time to deteriorationの中間解析結果については、最終解析の論文には触れられておりませんでした。しかし、確認しましたところ、NEJM2012の中間解析結果の論文で、以下のように触れておりました。(P525右下~P526にかけて)

The time to deterioration of ECOGperformance status and time to deterioration of quality of life (≧5%) were notstatistically different between the two treatment groups (data not shown).”

A1-2αの調整について

主要評価項目のPFSと、主要な副次的評価項目と設定していたOSの解析について調整しておりました。QOL等は、副次的評価項目であったため、α調整は実施しておりませんでした。

事前の解析計画では、「QoL解析はPFS評価時に同時に解析する」となっており、PFS中間解析(7カ月 フォローアップ)時点でポジティブな結果が出たので、QoL解析もその時点で行いました。その後、PFS最終解析時点でもQoL解析を行いました。

→以上の話は、BOLERO2試験がはじめられた当時HRQOLはおまけ程度の扱いで、そもそもアルファが割り当てられていない。にもかかわらず検定がなされているし、検定時には多重解析の調整もされておらず、中間解析が行われた事実すらHRQOLの最終解析時の報告では触れられていないということを示しています。知らなんだなあ~。

Q2:中間解析のイベント数が324、最終解析が36710%くらいしか変わらないのに、中間解析はmedian TDD4.5月と4.4月とほとんど同じでハザード比は0.91(95%CI 0.68-1.20 p=0.217)だったのに、論文では”Themedian TDD in HRQOL was 8.3 months with EVE+EXE versus 5.8 months with PBO+EXE(hazard ratio, 0.74; P<.0084)“と結果が大きく異なるのはなぜ?

A2:イベント数が10%しか変わらないのに数値が大きく変わるのは、観察期間がほぼ3倍になったことで打ち切りが少なくなったことが理由であるとのことでした。

打ち切り症例が観察されたことが中間解析と最終解析の結果の違いを説明するということが妥当かどうかを医療統計家の先生に問い合わせたところ、驚愕のコメントをいただきました。。。

Y先生:生存時間解析では打ち切りはほとんど情報にならない(たとえ追跡期間がグンと延びても)のですが、、、すぐには納得しがたい説明ですね。

わたくし:たとえば、ある時点で打ち切り症例が3/4あったのが、時間が経過して1/4になったとしても、イベント数が大きく変わらない場合=イベントが起こっていない人の観察期間が延びただけという場合は、PFSの中央値はほとんど変わらないはず、という意味に理解してよろしいでしょうか?

Y先生:各群のPFSの中央値は変わりますが、群間差であるHRとその精度(検出力と考えて良い)はほとんど変わらないはずです。しかしながら、ハザード比が大きく変動してるんですよね。10%のイベント増加で。。。本当かな、、

統計家の先生のコメントは、以下の様に理解しました。

informative censoringなどのバイアスが無ければ、打ち切りに群間差はない。とすると、PFSの値が変わったとしてもハザード比は大きく変わらない。反対に、ハザード比が大きく変わるということは、打ち切りにバイアスがあることが否定できず、データの信頼性に問題がある。

会社に統計家の先生のコメントを投げかけたところ、お返事を頂けるとのことでしたが、一月経過してもお返事を頂けていないので、一旦BOLERO2の件は終了します。

統計解析の経緯を見る限りにおいて、BOLERO2がはじめられた頃にはQOLは適当な扱いを受けていたこと、学会などでPROの重要性が取り上げられるようになってきたため、今後はきちんとした解析が行われるようになるのではないか、というのが現時点での個人的な感想です。


by aiharatomohiko | 2018-08-25 08:45 | 論文
<< BOLERO2から振り返るフリ... BOLERO2から振り返るフリ... >>