MIT Micro Masters 合格方法

ノマドのスキル

※上記画像は個人情報を保護するため名前等加工してあります。

2019年11月18日付でMIT Micro masters Statistics & Data ScienceのCredentialをすべて取得し、マサチューセッツ工科大学のMicro masterとして認定されました。

大学の数理に全く関係のない文系学部を卒業したにもかかわらず、高難易度の数理系ミニ修士号(Micro master)を取得した方法は、参考になる方もいると思われるので共有します。

ちなみに、この様な英語講座の日本語情報は限りなく少なく、HarvardやMITという大学名だけで何故か称賛されることが大変多いです。つまり、ポジティブなバイアスが多分に掛かっています。このMIT Micro masters Statistics & Data scienceに関しても、想像で記載したような信頼性のない情報を発信している方も散見されました。この説明ではその様な誤った情報ではなく、実体験に基づいた情報を提供します。

流れとしては、私の受験前のスペック、勉強時間、基本的な受験姿勢を説明し、次に各科目ごとの勉強方法等を記載していきます。

1. 受験前スペックと勉強時間

1.1 スペック

・大学の学部:法学部
・英語力:TOEIC 980程度
・数学力:統計検定1級程度
・プログラミング力:講座前にPaizaでPythonのSクラス程度
・仕事:前職は経営コンサル等

上記の通り、私は文系かつ法学部とは言えども、この講座の突破に必要な英語力や数学力、プログラミング力は一般的な受講生よりは遥かに高かったと言えると思います。講座を受講していても躓いたのは、今まで扱ったことのなかったR、統計分野におけるGLMや仮説検定の少々高度なもの、Machine Learningに必要なプログラミング知識等に限られました。結果として、これらの知識を今までの知識に上乗せし、効率的に吸収できたことは有意義な体験でした。

1.2 勉強時間

・Probability:週8時間×10+試験等10時間=90時間
・Data Analysis:週10時間×11+試験等10時間=120時間
・Fundamentals of Statistics:週12時間×7+試験等16時間=100時間
・Machine Learning:週12×11+試験等8時間=140時間
・Capstone Exam:4科目×25時間=100時間
・合計550時間

上記の通り、事前知識のあるProbabilityやFundamentals of Statisticsは殆ど勉強せずに済みました。一方、Rを使用する必要があるData Analysisや機械学習に特有のPython知識等を使用する必要があるMachine Learningについては、比較的多くの勉強時間を要しました。合計勉強時間は550時間と記載しましたが、事前の学習を含めると、実際にはもう50時間~100時間要したかもしれません。

2. 基本姿勢

2.1 勉強時間の短縮方法

勉強時間を可能な限り短縮するため、この講座を受講する場合、
・得意な科目や簡単な内容であれば動画の速度を1.25倍速
にすることを心がけました。また、スライドはダウンロードできるため、
スライドだけ見て簡単に理解できるような内容の場合は、すぐに練習問題に
取り掛かり、動画さえ見ませんでした。
なお、最終試験前にはほぼ全員間違いなく、過去のスライドを確認すると
思われるため、
・スライドは逐一ダウンロードして保存しておきましょう

2.2 複数科目受講の注意

科目を受講するときの注意点ですが、
・2つの科目の日程を被るようにして受講することはお勧めしません。
特に社会人の方の場合は要注意です。他の外国人受講生も時間が足りないため
講座の期限を延長してくれという投稿が何度もありましたし、実際に私も
ProbabilityとData Analysisを被る様に受講し、時間調整に苦労しました笑

2.3 役立つサイト

様々な有用なサイトがあるかもしれませんが、私が使用したのはほぼ以下のサイトでした。最終試験に関しても以下のサイト+Google電卓+Google翻訳のみで臨みました。最終試験を視野に入れ、使用するサイトは限定し、使用方法を極めて効率よく解答する癖をつけるのが良いかと思います。

WolframAlpha
関数を挿入すると自動計算してくれるサイト
最初は手計算で導出の流れを把握するのが重要でしょうが、
慣れたらこのサイトで計算してしまいましょう。
最終試験でもこのサイトの活用は認められていました。

Symbolab
関数を挿入すると自動でグラフ表示してくれるサイト
関数を感覚的に捉えるうえで役に立ちました。

Keisan Online Calculator
様々な分布のパーセンタイル点等を算出できるサイト
特に仮説検定時によく使用した覚えがあります。

3. Probability

確率の基礎的な問題を主とする科目であり、このMicromasterの中では最も難易度が低かったように思われます。ただし、全ての講座に繋がる重要科目であるため、絶対に手を抜かないようにしてください。例えば、各章のほかに、おまけとして掲載されている動画がありますが、特に初学者の場合、この動画まで見てしっかり理解しておいたほうが良いでしょう。

3.1 要点

各分布の意味や繋がりを把握し、その関係を説明できるレベルにしましょう。少し発展的な設問だと、分布間の繋がりの理解度を試すようなものが多かった印象がありますが、これを事前に理解しているのとしていないのとでは解答スピードや得点に大きく影響します。

3.2 おすすめの書籍等

今回、私の場合は和書は使用しませんでしたが、もし参考にするならば以下のような初級者~中級者レベルの本を事前に読んでおくと効率的に講義を受講できるでしょう。特に英語情報を英語のまま理解することに慣れていない方には、是非お勧めします。

弱点克服大学生の確率・統計

4. Data Analysis for Social Scientists

分布のモーメントやMultivariate Distribution、Rを使用する問題等、データ解析方法を学ぶ講座でした。この講座については特に、問題提出時の不具合やスタッフの対応が悪い等の悪評が相次ぎました笑。実際私もこの講座を受講して、「これが本当にMITかよ・・・」と思うほどでした。。。内容はもちろん全て重要であり、特にRに慣れていない方はこの講座を一通り理解するだけで、そこそこ使えるようになれるのではないかと思われました。

4.1 要点

問題のレベルとしては先述のProbabilityと同レベルか低い程度だったような気がします。従って、私のようなR初学者の場合、この科目にスムースに合格して最終試験に繋げる要点は、Rにいかに慣れ自分のものとしていけるかです。この科目ではRの便利なチートシートや使用方法詳細が含まれているため、それらを活用するだけで合格には十分でした。下手に書籍等を購入するよりも、科目中で扱っている資料を十分に理解するようにしましょう。R初学者の場合、最初は大変かもしれませんが、間違いなく実力は付くので楽しんでいきましょう。

4.2 おすすめの書籍等

この科目の資料以外には不要だと思います。強いて言えば、統計分野の問題の確認のため、Probabilityでも挙げた「弱点克服大学生の確率・統計」を解いておくといいでしょう。

5. Fundamentals of Statistics

一言でいえば先述の2科目の理論部分の高難易度版です。Delta method、GLM、Jeffreys prior等、一般的な文系は耳にしたことのない様な事項を扱い、問題自体も多少高度になってきます。この講座の中で難易度が最も高い科目はどれか?と聞かれたら、恐らく多くの方がこの科目を挙げるでしょう。実際に、受講者達の投稿で、「A氏:この問題は今まで解いてきた問題の中で一番難しいものだった。」「A氏:前回の投稿は撤回だ!やはり今解いている問題が一番難しい。」という様なものがあった気がします笑

5.1 要点

Probabilityの要点でも挙げた重要事項ですが、この科目では特に分布間の繋がりの理解が重要となります。自分なりのチートシートを作成し、どの分布とどの分布につながりがあるか把握しておくのも良いでしょう。各問題を理解するのが困難だったり、諦めたくなることもあるかもしれませんが、その場合は基礎知識が不足している場合もあるため、ProbabilityやData Analysis に戻って基礎事項を確認するのも良いでしょう。問題自体は難しいものの、じっくり焦らずに考えれば解けるものが多かった覚えがあります。実際、私に関しては、最終的な得点は他の科目と大差ありませんでした。

5.2 おすすめの書籍等

科目中にある動画や説明が一番まとまっていると思われました。内容は多少困難かもしれませんが、焦らず理解していきましょう。また、他の科目と同様に、各章ごとにおまけ動画があるため、こちらを見れば解決する場合も多いです。この科目については、ほぼ全員が難しいと思っているでしょうが、焦って理解せずに前に進むことはお勧めしません(どうせ最終試験の前に全て確認するので。)。

6. Machine Learning

この科目の最大の特徴は「Project」という実際にPythonのコードを打ち込んで評価される問題があることです。そしてその比重が全体の36%を占めるため、無視することはできません。割と判定がシビアなため、私はこの科目のProjectを提出するのに最も時間を要しました。一方、このProject以外の設問に関しては他の科目と比較しても大分簡単だったように思います。Machine Learningの基礎的な知識がある方なら、何故こんなに簡単なのかと驚くほどかもしれません。

6.1 要点

Machine Learningの基礎知識を和書等で学び、関係のあるコードを理解しておけば、この科目は簡単に合格できるように思いました。もちろん、Pythonの基本的な知識は大前提です。例えば中にはnumpy.dotを使用して行列演算を行わなければ解答として受け付けないような問題(ループは時間がかかってダメ)もあるため、効率良い解答コードを提出することが必要になります。

6.2 おすすめの書籍等

Backward Propagation(誤差逆伝播法)等の基本的な知識を学ぶため、以下の書籍を事前学習として使用しました。著作権上このブログでは公開できませんが、自分用のまとめを作成し、体系的な理解に努めました。この講座を合格する上でも、役に立つことは間違いないかと思います。

ゼロから作るDeep Learning

ゼロから作るDeep Learning 2 -自然言語処理編-

7. Capstone Exam

最終試験です。勉強した各科目の理解力を総合的に試される試験であり、Proctored Examであるため、自宅等で自分のパソコンにカメラを用意し、専用ソフトウェアをダウンロードし、監視状態でテストを受験します。全部で4つのテストがあり、時間は1科目2時間と短いものの、今まではこのような厳しい時間制限がなかったため、緊張された方や時間の足りなかった方も多かったことでしょう。
今回の第1期では約130人が最終試験に受験し、約90名程度が合格したようです。今までの試験を合格してきた猛者達が落ちる可能性がある試験であるため、油断は全くできません。

7.1 要点

A4用紙表裏4枚分のチートシート×2(前半のテスト分と後半のテスト分)を自分で用意することが出来るため、過去に受けた科目を振り返る意味でも、自分にとって重要だと思われる点を記載して試験に備えましょう。
また、結構な分量ですが、各科目の練習問題を一通り終了させることも効果的です。テストは広範囲の中から出題されるため、弱点を作らないように対策すれば合格率は大きく上がることでしょう。
なお、最後まで諦めずに試験を完遂させることも重要です。個人的には、2つ目の試験で大失敗したことが結果を見る前から分かってしまったため、その後のテストを受験するかも一瞬迷いました。結局は最後まで受験し、3つ目と4つ目の試験が自分にとって比較的簡単な試験であったため、最終合格することが出来ました。もしかすると、このような点も試されていたのかもしれません。

7.2 おすすめの書籍等

過去に受けた科目の確認を行うのみです。わからない問題を極力ゼロにしておきましょう。

8. おわりに

MIT Micro masters Statistics & Data Scienceは、元々そこまで気合を入れて臨んだものではありませんでしたが、運も良く最終合格することが出来ました。

最後まで継続できたのは、やはり科目ごとに自分の成長を感じ、今まで解くことが出来なかったような問題が解けるようになり、思考の幅が広がることに喜びを感じ、楽しんで受講をすることが出来たからだと思われます。今後のデータサイエンス分野の盛り上がりや必要性は間違いありませんし、どの様に生きていくにあたっても有用で魅力的なものだと考えていたことが、大きな原動力となりました。

以上、私の受験履歴を振り返ったメモのような投稿でしたが、同講座を今後受講する皆さんの参考に少しでもなれば幸いです。

 

コメント