About Coldstart.nlp and about myself.

Source: Deep Learning on Medium


Coldstart.nlpの概要と記事紹介、少しだけ自己紹介

Photo by Alain Wong on Unsplash

Coldstart.nlpは、自然言語処理を中心とした機械学習に関する記事を投稿する個人メディア.


目次

  1. なぜ僕が機械学習に投資するのか?
  2. なぜ僕が記事を書き始めたか?
  3. これまでの記事紹介

1. 自己紹介

こんな顔ですみません.

1–1. Bio的な自己紹介とキャリアについて

1993年生まれの25歳, 性別は男.

好きなアーティストは岡本太郎とMike Posner.

茨城県で生まれて, 栃木で育ち, 大学で北の大地に上陸.

1年の休学期間&海外NGO活動を経て, 北海道大学経済学部を卒業.

その後計2年間のキャリアにおいて, 2社のスタートアップでマーケティング部門のデータアナリストとして経験を積む.

1–2. Why did you started 機械学習?

前提, これまでのキャリアはインターネット&スマホで起業するひと世代上の方々に影響を受け, いつかは自分も「0からマーケティング&デザインしたプロダクトを生み出す」という目標への算段の上に成り立っていた.

しかし, 2社目のスタートアップでインターネット以降のスタートアップ投資の歴史のリサーチや, 自社のPMF (from Idea to prodact) 段階のプロダクトと向き合っているウチに重要なインサイトをいくつか得た.

詳しい話は他の記事でまとめるが, 大きく3つの発見があった:

  1. Bussinessはある大きなテクノロジーのトレンドや波をテコに, 過激なまでに集中した資金が集まり, 1つの時代が生まれること.
  2. 既存市場への参入アングルという論点だと, テクノロジーによる効率化&生産性向上は成功確度が高く, 歴史上何度も繰り返されていること.
  3. 最後にComputer Scienceについて個人的な勉強を進めるウチに, ソフトウェア的な思考法やその応用可能性に大きく心を奪われたこと.

特に3つ目の理由は, もともと日常の業務で遭遇するソフトウェアやテクノロジー用語に対して表面的には理解できるがその中身を捉えきれないもどかしさから, 「技術の無知」へのコンプレックスは人一倍強かった.

また, 個人的にはインターネット&スマホの波は, 民主的で優しい技術ブレイクだったが, これからのブロックチェーンや機械学習などの技術トレンドは内側からいじらないと本質的な理解を得られないのではないかという危機感があった.

そこで非エンジニアから1年の自己学習を経て, AirbnbでData Scientistのポジションを手にしたKelly PengこのMediumポストや, CanadaでTOP10に入るMasterで勉強する権利を拒否して, MOOCやStanfordDavid Venturi

1–3. で、今は何を?

開発者として自らの手で機械学習をビジネスに応用していく意思決定をした後, 2社目のスタートアップを退社して, 現在はインドのBangaloreでMachine Learning Bootcampに参加している. (19年4月に帰国予定)

その傍ら, 機械学習を実務で使えるポジションの職を得るために自然言語処理を中心に, 主にPythonで個人的な実装を試みている.

機械学習のポートフォリオやCVはGitHubにて.

1–4. おまけ: インドのテック中心地, Bangaloreはどんな感じ?

まず自分がBangaloreにわざわざ向かった理由は大きく3つある.

  1. Bangaloreには, 100を超えるデータサイエンスや機械学習のプログラミングスクールが存在し, 高価格帯のスクールであればその競争力から東京のそれよりも質が高い上にコストが安いと踏んだ.
  2. 英語で技術に触れたかった. 自分はプログラミングスキルではソフトウェアエンジニア出身の候補者に勝てないため, コーディング力を磨くのはもちろんのこと, 大学時代の留学をきっかけに育ててきた英語力を武器に英語論文を読む力などで差別化しようと思ったため.
  3. 最後はリスクヘッジ. 日本のIT企業がself-taughtな技術者をどこまで信用するか未知数だった. Linkedinで見ると, BangaloreにはData ScientistやML Engineerの求人が東京の数十倍あり, 友人もBussines Analystからの転身を成功させていた. インドでの就職も選択肢に入れたかった.

Bangaloreは,かなり夢がある場所ですね. GoogleやAmazon, Flipkartなどのオフィスがあって, かなり高給なサラリーで働くDSや機械学習エンジニアがいる.(日本企業だと楽天がR&Dオフィスを構えたりしている)

ML Engineerは需要だけでなく, 供給も多いため就職競争はかなり激しい.


2. なぜ僕が記事を書き始めたか?

2–1. はじめに

ここに僕が好きな機械学習界隈についてのオピニオンがある.

Machine learning is taught by academics, for academics.
– That’s why most material is so dry and math-heavy.

Developers need to know what works and how to use it.
– We need less math and more tutorials with working code.

これは, 購読者数20万人を超える世界最大の機械学習Tutorialサイトの1つ, ”Machine Learning Mastery”の創業者であるJason Brownleeの言葉.

日本語に翻訳すると,

機械学習の学習教材(Couseraとか含めて)ってほとんどがアカデミックの人による発信で, エモさのかけらもなく, ひどく数学重視すぎる.

開発者にとっては実際のビジネスで使えるかが重要だから, 数学的な理論はほどほどにして, 実際に動くコードに触れるチュートリアルが必要だ.

実際僕は, このMachine Learning MasteryのTutorialをいくつかこなすことで, 実際に動くコードをかけるようになった. 一番信頼している, 大好きなTutorialサイトである.

2–1. 理由と目的

上記の話を踏まえて僕が個人的なML周りのコンテンツの発信を始めたのには, 大きく理由が3つある.

  1. 初学者の自分にとって機械学習は理論やトピックが多く, 自分の脳みその外に自分の言葉で整理する場所, いつでも戻れる場所が必要だった
  2. 自分のようにほとんど0からこの領域に挑戦する全ての人々に, 体系的に整理された知識やTipsを提供する挑戦がしたかった
  3. 純粋なMedium愛. 自分はここに集まるプロの執筆家ではない個人から発信される, 洗練された記事から何度も驚くべき学びを得た

2–2. ミッション・バリュー

2–3. ターゲット読者

3. Site

Data Science Workflow Series

Natural Language Processing Series

Deep Learning from scratch

Math & Statistics in Machine Learning
2. **ML workflow** 9
3. **NLP** 5
4. **CNN LSTM MLP** 1