江別等、札幌圏のカウンセリング

札幌|のっぽろカウンセリング研究室
トップページへ

トップページ >> 方法論ノート

多忙な心理臨床家にも可能な
カウンセリング効果研究のデザイン


 多忙な臨床現場で働く心理臨床家は、なかなか調査研究に着手することが難しいはずです。なぜならば、時間がありませんし、倫理的な問題もありますし、それどころではないのです。しかし、現場の臨床家がリサーチすることを阻む最も大きな要因は、リサーチのデザインをしっかり整えることが難しいところにあるのかもしれません。今回は、多忙な臨床家でも可能な、簡単なカウンセリング効果研究のための、デザインについてお話します。

[追記 2014/4/10]
 このページでは大規模研究についてしか紹介していませんでしたので、事例研究に関しても追加しておきます。単一事例を用いた実証的な効果研究でして、これはスキナーが大昔に提唱して今日に受け継がれているシングル・ケース・スタディの手法を洗練させたものです。行動主義は大嫌いという方もいるでしょうが、まあ読んで下さい。
 最近になって、a case based time-series analysisとか、a single-case study using a time-series designと呼ばれる手法が考案されました。分析に使われる統計解析は、simulation modeling analysisというものでして、統計学の素人には詳しいことを述べることができませんが、フォルス・ポジティヴに対して鋭敏に作ってあるそうです。ブートストラップ法を使った、とても洗練された解析ができます。
 この手法の立役者は、Jeffrey J. Borckardtでして、こちらがネット上で入手可能な基本論文となっています。こちらにある"
02-ampsych.pdf"をクリックしてください。http://web.utk.edu/~mnash/pdfs/articles/
 このデザインを使った論文がアメリカでかなり増えています。学位論文もあって、それは3事例のみの仮説検証型論文でした。ネット上には、たとえばこんな論文があります。これは、治療的アセスメントの事例研究です。こちらとか、こちらです。
 ありがたいことに、simulation modeling analysisのためのフリーソフトも公開されています。こちらにアクセスして、SMAの該当箇所をクリックしてください。→http://clinicalresearcher.org/software.htm
 さて、ひじょうに洗練された解析手法ですが、デザインとしては、オーソドックスにやります。評定のポイントは、毎日です。たとえば、クライエントに同一の自己評定尺度を毎日やって頂くわけです。いわゆるABAB法でもよいし、AB法でもよいし、ABC法でもよいです。各段階は、30未満のNに抑えることが推奨されています。検定力が落ちるからです。しかし、いろいろと論文を見ていると、それを超えているものがかなりあるようです。
 たとえばこんな感じです。介入前に、ベースラインのデータを取ります。毎日、14日分はほしいところです。次いで介入してデータを取ります。30以下にしたいですが、超えてしまっても仕方ないところでしょう。そして、フォローアップ期に入って、これも毎日取ります。私のブリーフセラピーの場合は、ベースライン14日、介入期40~50日、フォローアップ期30日くらいになります。
 この三つの段階について、スロープの傾きに違いがあるか、段階としての違いがあるか、検定するわけです。ほんとうに、個別事例における効果研究という感じになります。論文の書き方は、数量的分析だけでもよいでしょう。アメリカン・スタイルは、カウンセリングのプロセスを記述する第Ⅰ部、分析結果を示す第二部、考察する第三部、という形式のものが多いです。ただ、これだと枚数が膨れ上がります。英語論文を見ていると、かなりの枚数ですね。日本の学会誌は、枚数制限を緩和してほしいものです。強く訴えたいです。
 毎日のデータが必要ですから、クライエントの負担を考えると、かなりコンパクトな質問紙がよいですね。工夫が必要です。そして、必ず欠損値が出るでしょうから、補正することも必要になってきます(時系列データですから欠損は致命的です)。推奨されているのは、期待値最大化法(EM法)です。これは、統計解析ソフトSPSSのミッシング・バリューというソフトに入っています。うーん、ちょっと高価かな。何かフリーソフトがあればよいのですが、私はまだ発見していません。(発見しました。高性能の統計解析ソフト、おまけにフリーソフトでもある"R"を活用したものですが、Ameliaという高性能の欠損値用ソフトが、こちらと、こちらで入手可能です。フリーソフトです。EM法をブートストラップ法を加味して発展させたアルゴリズムを使っているそうで、内容的には問題ないようです。ただ、Rを使いなれている方でなければ、かなり苦労しそうですね。Gooooood L!!!! ちなみに、欠損値は全体の20%以内であれば大きな影響はないというのが一般論でしょうが、期待値最大化法を使って自己相関のある時系列データを補正するときには、全体の40%まで欠損していても問題はないという研究結果もあります。モンテカルロ実験で確認した研究です。)
 治療的アセスメントの論文で、この手法を使っているものが多いです。使いやすいのは、セラピーの回数が比較的少ないブリーフセラピー系です。まあ、毎日ではなくセッションごとのデータを使うのであれば、たとえば週1回で30回くらいであればよいと思います。そのときには、ベースラインも週1回でそれなりの回数のデータが必要です
 いまのところ英語が読めないとソフトも使えません。みなさん、がんばってマスターして下さい。これからの事例研究法の主流になっていくであろう優れた手法です。声を大にしてお勧めします。
 データ数の問題ですが、ひとつのセグメントが30以内であればシミュレーション・モデリング・アナリシスは大いに力を発揮してくれます。もしも50~60くらいひとつのセグメントに確保できるのであれば、普通にARIMAモデルを使って分割時系列分析(中断時系列分析)を行った方がよさそうです。しかし、これを行う場合は、SPSSだとちょっと難儀です。なぜなら、その分析手法がパッケージされていないからです。でも、参考になるサイトがありますから、調べてみてください。(こちらのサイトの21番目をクリックしてください。英語ですが、SPSSを使った分割時系列分析のやり方が解説されています。こちらもいいです。)面倒な方は、STATISTICAというソフトを購入してください。いまは東芝さんから購入可能のはずです。20万円くらいかな。ありがたいことに、これには入ってますよ。
 それから、さまざまな時系列分析を行うためのフリーソフトが公開されています。ドイツの経済学者が開発して無料配布しているものです。こちらのJMuTiです。これだけのソフトを購入するとなると、おそらく10~20万円はするはずです。単一事例研究によるセラピーの効果を判定する以外に、一事例の時系列データに関する、ボラティリティ、関連性、因果関係などを解析したい場合に、大いに役に立つはずです。私としては、共和分の解析が普通にできちゃうので、ありがたいかぎりですし、時系列分析を行う前の下準備の検定ができることもありがたいです。ただ、マニュアルがないのがあれですけどね。

[追記 2015年3月8日]
 単一事例研究のための便利なソフトを追加します。すべてフリーソフトです。
・こちらのサイトは、行動分析系の方に向いていると思います。→Single Case Research
・エクセルでできてしまうExPRTです。→こちら
・複数の事例を集めてマルチレベルの分析ができるそうです。→こちら

[ここまで]


 効果研究を行うとき、必ずそのデザインが問題となります。一番の問題は、効果研究であるかぎり、統制群・コントロール・グループを置かねばならないということでしょう。しかし、最近は、統制群をおくことには倫理的な問題があるとして、それをおかないで行うデザインが考えられています。倫理的な問題とは、統制群をおくことが、クライエントに対して最適な援助を与えないことになることを言っているのです。たとえば、すぐに薬物療法を開始するのが適切と判断されるクライエントを、待機リストに載せたままにしておくことになりかねないのです。

 さて、統制群をおかない効果研究のデザインは、さまざまな研究法のテキストに書かれています。ここでは、Alan E. Kazdin (2003)Research Design in Clinical Psychology. Allyn and Bacon.から、少しだけ触れることにします。

 リサーチのデザインは、カウンセリング開始前と終了後に何らかの同一尺度で測定する、プリテスト-ポストテストの形にします。しかし、前後の数値を単純にT検定で調べることは、好ましくありません。有意差があったとしても、それはあくまで統計的な有意にすぎないのです。求められるのは、臨床的な有意ということなのです。

 統制群をおかない場合、臨床的に有意な効果ありとされる基準は何なのでしょうか。この基準として使われるのは、母集団の正常範囲、ないしカットオフ・ポイント(分割点)です。ですから、リサーチに使われる尺度は、しっかりと標準化されていて、パーセンタイルや、T得点などの資料が公開されているものを使う必要があります。ここがしっかりとしていない心理尺度は、ことのほか多いのです。

 パーセンタイルで話を進めましょう。一定期間、クライエントにカウンセリングを行いながら、プリテストとポストテストを実施します。たとえば、3年間で100人分のサンプルが集まったとします。この100人のうち、プリテストのパーセンタイルが70以上のクライエントが70人、69以下の人が30人でした。正常値を逸脱して高得点だったのは70人ですから、この70人が、ポストテストではどれくらいパーセンタイル69以下の正常値に下降するのかということが問題になります。

 プリテストからポストテストの数値が分割点以下に下降した群を変化群、下降しなかった群を無変化群と名づけましょうか。かりに、この70人のうち、変化群が55人、無変化群が15人になったとします。統計的に検定すべきは、両群の人数の差ということになるでしょう。ノンパラで分析してみましょう。もしも有意な差があれば、効果ありと判定されます。

 次のリサーチ・デザインです。

 しっかりと作られた尺度であれば問題はないのですが、もしもカットオフポイントが不明な尺度を使ったとしましょうか。こんなとき、どうすればよいのでしょうか。

 やはり、プリテスト-ポストテストのデザインにしてみましょう。この場合、パーセンタイルでもT得点でもよいので、まずはプリとポストの平均値を算出します。さて、ここからが問題です。すでに述べたように、T検定で差を検定することはしません。ここで臨床的な有意の基準となるのは、標準偏差です。こうです。ポストの平均値が、プリの平均値よりも、2標準偏差以上下降していることが求められるのです。つまり、プリの平均値-2標準偏差>ポストの平均値ということです。(電卓で計算可能ですが、数式は提示しません)

 とても、とても厳格な基準ですね。2標準偏差ですから。研究者のなかには、この基準はきつすぎるので、1標準偏差でよいのではないかという人もいます。さらには、重篤な精神病理をもつクライエントの場合には、0.5標準偏差で十分ではないかと主張する人もいます。このあたりの議論は、たまに米国のパーソナリティ・アセスメントの雑誌に掲載されています。

 統制群をおくのは、なかなか現実的には難しいです。そこで、統制群をおかないデザインを紹介したのですが、なかなか基準が厳しいですね。

 最後に一言。私は統計学やリサーチ・デザインの専門家ではありません。もしかしたら、重大な読み違いがあるかもしれませんので、くれぐれも原書を当たるようにして下さい。それから、リサーチに着手される臨床家は、研究倫理だけでなく、職業倫理を順守した上で行って下さい。クライエントの福祉を最優先しなければならないのは、私たちの使命なのですから。リサーチのためのリサーチなら、やめてほしいです。






関連記事

札幌・江別等、札幌圏の相談援助