統計検定データサイエンスエキスパートを受験してきました

お久しぶりです。今回は、統計検定の一種であるデータサイエンスエキスパート(DSエキスパート)を受験してきたので、その記録を備忘として書き記そうと思います。

といっても、ほとんどDSエキスパートの紹介と「実際こんな問題が出たよ」という内容であり、「こんな対策がおすすめだよ」的なことはほぼ書いていない(というか書けない、理由は後述)ので、その点ご了承ください。

DSエキスパートとは?

統計検定には以下のように複数の種別(2024年12月時点で10個)存在し、その内容により大きく3つのグループに分かています。そのうちの『③データサイエンス分野に特化した試験』の中で一番専門性の高い試験がDSエキスパートだと理解しています。

グループ(※筆者の主観)試験種別
①統計学の内容に特化した試験・1級
・準1級
・2級
・3級
・4級
②公的統計・統計調査に特化した試験・統計調査士
・専門統計調査士
③データサイエンス分野に特化した試験・DS基礎
・DS発展
DSエキスパート

試験範囲は公式ページにて掲載されているのですが、とにかくべらぼうに広いです。1〜4級の範囲である確率統計はもちろん、『データベース』『テキストデータ解析』『ディープラーニング』『AIの歴史』など多岐にわたります。

ただし1級ほど1つのトピックについて深く問われることはなく、どちらかというといろんなトピックについて広く浅く問われる印象です。(ただし理解が浅すぎると解答は難しい)

試験が開始されたのが2023年5月のようなので、他種別と比べるとかなり日が浅いです。本記事執筆時点ではネットにも情報があまり出回っていないので、受験者も多くはないのかなと推察されます。

その他の試験内容は以下です。

  • 試験時間:90分
  • 問題数:約40問
  • 合格水準:60点(100点満点)
  • CBT方式
  • 電卓を使用
  • 受験料:8,000円(学割あり)

受験のきっかけ

私がDSエキスパートを受験しようと決意したのは11月ごろでした。当時、SNS上では毎年恒例の統計検定1級を受験される方が散見されてたのですが、その方たちのポストを見ているうちに「そういえば統計検定って”DS〇〇”みたいなのあったな、試しに受けてみようかな」と思い立ちました。

調べてみると”DS〇〇”系には上記の通り3種存在し、その中で一番難しそうなDSエキスパートのサンプル問題を試しに見てたところ、

  • 簡単なSQL文・Pythonコードの穴埋め
  • 平均の差の検定
  • ロジスティック回帰における最尤法によるパラメータ推定

で構成されており、「え、めちゃくちゃ簡単やん。これならそんな勉強しなくても受かるかも!!」と思い、12月下旬の回を受験申し込みしました。

注意:上記はあくまでサンプル問題であり、本番ではもっと多くの問題が出題されます

また他のモチベーションとして、当時仕事があまりうまく行っておらず自己肯定感が若干下がっていたのですが、簡単な試験でも合格できれば自己肯定感を上げられそうだなと思ったのも、受験のきっかけの1つです。

私が実施した試験対策

上記の通りサンプル問題はかなり簡単だったのですが、区間推定・仮設検定まわりの記憶がかなり消えてしまっているなと感じたため、その辺の復習だけ行うことにしました。

そこで『明解演習 数理統計』(小寺 平治)の第6, 7章を中心に演習問題を解き、区間推定・仮設検定まわりの計算や電卓の使い方のリハビリを行いました。

この本、統計学の基礎的な内容がかなりコンパクトにまとまっており、かつ演習問題も豊富にあるため、こういう試験対策の勉強にはもってこいだなと今回改めて思いました。

(最初は『データ解析のための数理統計入門』(久保川 達也)で勉強していたのですが、DSエキスパート対策としては過剰かなと感じたため、上記の勉強に切り替えました。)

上記2冊ではDSエキスパートの膨大な出題範囲は全然カバーできていないのですが、「まあなんとかなるでしょ」と楽観的に考え、特に何もしませんでした。

受験時の試験内容

そうやって迎えた試験当日ですが、試験序盤の時点で「あ、これ完全に舐めてたわ」と思うほど膨大な範囲から出題されました。具体的には、以下に関する問題が出題されました。(忘れてしまいましたが他トピックの問題もありました)

  • ファイルのハッシュ値
  • Mecabを使った共起ネットワーク
  • CNNの各層における次元数
  • 回帰係数の性質・LOOCVの評価式
  • 線形計画法
  • 重点サンプリング
  • 母比率の区間推定
  • SQLによる集計
  • カーネル密度推定
  • クロンバックのα係数

正直見覚えが全くない内容の問題もあり、設問も40問と多くかなりテンパりました。。。が、CBTで基本5択なのと、問題によっては内容を知らなくても解答できる or 選択肢を絞れるものもあったため、90分フルで使い何とか完答することはできました。

CBT試験ではその場で合否がわかるのですが、結果なんとかギリギリ合格することができました。。。あと1~2問ミスっていたら不合格だったと思います。

どんな試験対策がよい?

試験対策ですが、先述の通り範囲が膨大なため、網羅的に対策することはほぼ不可能だと思います。現時点で公式参考書・問題集はまだ出版されていないのですが、これだけの範囲を1冊に詰め込むことが難しいのも理由なんじゃないかなと推察しています。(出るとしたらめっちゃ分厚くなりそう)

なので、様々なデータ分析手法をキャッチアップし、(可能であれば)実務等でトライするという営みを常日頃行っていくしかないのかなと思います。かつ、1〜2個のトピックについては、自信を持って解答できるほど理解を深められるとベターかなと。

またいきなりDSエキスパートの合格を目指すのではなく、他種別の試験(準1級・2級・DS基礎・DS発展あたり)を抑えてからDSエキスパートを受験するのもよいかもしれません。

実際、DSエキスパートの出題範囲表には、以下のように2〜4級・DS基礎・DS発展の範囲も含まれる旨が明記されています。

終わりに

今回は統計検定DSエキスパート試験の受験記録を、備忘もかねてまとめてみました。

DSエキスパートは範囲も広く情報も少ないため、難易度は比較的高めの試験だと思います。ただ、範囲が広い=データサイエンスの技術トピックが網羅されている、ということなので、DSの技術スキルの力試しにはもってこいの試験だと感じました。

今後受験を検討されている方に、少しでも参考になれば幸いです!!

参考:

過去に書いた統計調査士・専門統計調査士の合格体験記も、よろしければご覧ください!!

コメントする