USAIDが途上国で広く行っているDemographic and Health Survey (DHS)。日本語では『人口保健調査』と訳されるらしい。
文字通り保健関連のデータを多く含むため、開発業界の保健セクターではしばしば引用される。ただ、家計データを広く取得しているため、使い方によっては保健以外のセクターでも活用できる可能性が高い。質の高いミクロデータを無料で使えるため、研究者だけでなく実務家も使う機会が増えることだろう。
唯一の難点は、統計ソフトでデータを触ってみると判るが、慣れるまで時間がかかること。例えば個別の国ごとにレポートが作成されているが、その結果を実際に自分で再現してみようとすると、一筋縄ではいかない。
その最たる理由は個別レポートに分析の過程が親切に書かれていないことだろう。統計のスペシャリストや研究者であれば、すぐにわかるのかもしれないが、データ分析に不慣れな実務家にとっては若干説明が欲しい点も散見される。
今回はデータセットの中で、『Sample Weight』がどう入力されていて、どう扱えば分析に使えるか、説明する。
こうした内容を個人的なメモの共有として、今後も気付くたびに掲載していきたいと思う。マニアックな内容だが、物好きな誰かのために。