『社会人のためのデータサイエンス』のWeek3、最終回は「グラフを作るとき・読むときの注意点」だった。
Q)統計において、恣意的なグラフにしないための注意点について
統計グラフを作成する際に恣意的にならないようにするための注意点は以下の通りです。
- 適切なスケールを使用する:
- 軸のスケールを調整して、データの差異を誇張しない。
- データの選択に注意する:
- 自分に都合の良いデータだけを選ばないようにし、全体像を示す。
- グラフの種類を適切に選ぶ:
- データの性質に合ったグラフ(棒グラフ、折れ線グラフ、円グラフなど)を選ぶ。
- 視覚効果を控えめにする:
- 色や3D効果を使いすぎず、データの正確な解釈を妨げない。
- データラベルや単位を明示する:
- 誤解を招かないように、全てのデータにラベルや単位を記載する。
- 参考文献やデータソースを明示する:
- データの出典を示し、信頼性を高める。
- 比較を公正にする:
- 比較する項目が異なる場合は、分かりやすく説明する。
これらの点に注意することで、グラフが恣意的に解釈されるのを防ぐことができます。データの正確性と中立性を保つことが重要です。
以前、ある意思決定の参考とすべきアンケートを行った際に円グラフを作成したのだが、母数を対象者全体にするか有効回答者数にするかでグラフから受ける印象が大きく異なる、という体験をした。母数を全体にして「無回答」を要素に加えるのが正しい(誠実な)グラフ。母数を有効回答者数にすると「殆どの人は賛成している」という印象を与えられる。賛成側に誘導したい、という意図がある場合には、母数を有効回答者数にする事も可能だった。動画の中で"「詐欺グラフ」で検索すると、いろいろな例が確認できます"とあって苦笑い。
Q)詐欺グラフとはどのようなものですか?
詐欺グラフとは、データを誤解させたり誇張したりするように設計されたグラフです。以下のような特徴があります:
- スケールの不正確さ:
- Y軸のスケールを変更して、変化を大きく見せる。
- データの選択バイアス:
- 自分に都合の良いデータだけを表示し、全体の状況を隠す。
- 誤ったグラフの種類:
- データに適さないグラフを使うことで、誤解を招く。
- 3D効果や視覚効果の過剰使用:
- データの理解を妨げる装飾が多い。
- データ範囲の操作:
- データの一部を省略したり、特定の期間だけを取り上げたりする。
- 軸のラベルや単位の欠如:
- ラベルや単位を省くことで、データの解釈を難しくする。
これらの手法は、意図的または無意識のうちにデータの解釈を歪めるため、注意が必要です。
なるほど、検索してみると解説しているサイトや記事がたくさん表示された。東京都の例は、人々のコメントも含めて参考になる。
こちらも、具体例が挙げられていて面白かった。