公開日:2021年11月7日

ROC曲線で求めたカットオフ値で群を分け、生存曲線を作成する意義について

事務局様

平素より大変お世話になっております。
北里大学医学部循環器内科学の及川淳です。
最近以下の研究デザインと統計解析をしている論文を立て続けに読み、そのデザインの妥当性につきご教示頂きたいと思い、メールさせていただきました。

以下、具体例です(内容は当方のオリジナルです)。

目的:自宅から職場までの移動時間が心疾患に与える影響につき検討する。
対象集団:30歳から65歳の成人で、自営業以外、通勤手段は問わない。
主要評価項目:組み入れ時から3年以内の主要な心血管イベント(心血管死、非致死性心筋梗塞、非致死性脳梗塞)
結果:平均通勤時間は75分だった。ROC曲線を用いてカットオフ値を求めたところ、80分という数値が得られたため、このカットオフ値で対象集団を2群に分け、カプランマイヤー曲線を作成してログランク検定をしたところ、通勤時間の長いグループが短いグループと比較して統計学的に有意に心血管イベントが多かった。

以上となります。
当方の疑問点は、ある集団で求めたROCのカットオフ値を用いて、同じ集団にあてはめて2群に分割し解析した場合、2つの群に有意差が生まれるのは当たり前のように思え、生存曲線を作成する必要性につき疑問を感じてしまいました。
例えば、ある集団で求めたROCのカットオフ値を別の集団にあてはめて生存曲線を求め解析した場合(バリデーション)はこの数値は妥当と判断(数値に意味がある)できると考えますが、上記のような解析の必要性、妥当性や頑健性につきご教示頂ければと思います。

よろしくお願い致します。

及川 拝

及川 淳|2021年11月7日 08:16

及川先生

ご質問いただきありがとうございます。
当方で、早急に対応させていただきますので、しばらくお待ちください。

事務局

プログラム 事務局|2021年11月7日 13:55

及川先生
お世話になっております。
以下のように回答いたします。

ROC曲線を用いてカットオフを決めることは、アウトカム発生に対し、最も識別力の高い通勤時間をデータから探していることですので、同じデータで生存曲線などで群間比較を行えば最も判別される結果は当然です。
先生のご提案通り、あるデータROC曲線を用いて求めたカットオフは、その後他のデータに適用して、群間比較し、求めたカットオフ値がアウトカムのリスク評価として有用かを検討することは、求めたカットオフの妥当性や頑健性のためには必要なプロセスです。
逆にそれを行わずに、同じデータ内でROCと群間比較を行うことは、妥当性や頑健性に問題がある可能性があります。
この研究は、マーカー研究と同様に考えることができます。森本剛著『査読者が教える 医学論文のための研究デザインと統計解析』のマーカー研究のトピックなどをご参考いただけますと、さらに理解を深めていただけるかと思います。

またご遠慮なく、ご質問ください。

事務局

プログラム 事務局|2021年11月12日 11:56

事務局様

お世話になっております。
ご回答いただき誠にありがとうございます。
理解がだいぶ整理できました。

今後もよろしくお願い致します。

北里大学医学部循環器内科学 及川

及川 淳|2021年11月13日 15:24

及川先生

お世話になっております。
こちらこそ、貴重なご質問をありがとうございました。
また、遠慮なく、ご質問いただければと存じます。

ところで、今回も、匿名化をはかったうえで、今回のやり取りを、公開をさせていただいてもよろしいでしょうか。

事務局

プログラム 事務局|2021年11月17日 09:56

事務局様

お世話になっております。
もちろん、公開して頂いて構いません。

よろしくお願い致します。

及川

及川 淳|2021年11月17日 11:07

及川先生

ご賛同ありがとうございます。
一つ一つの質問が、大勢の方にとって有益になりますので、大変ありがたく思います。
オリジナルの事例、ということで、ほぼ、そのまま掲載させていただこうと思います。

よろしくお願いいたします。

事務局

プログラム 事務局|2021年11月17日 14:21

ディスカッションは終了しました。

Shopping Basket