データサイエンティストの定義とスキルセットについて

要約

そろそろデータサイエンティストの定義とスキルセットについて本気で考えてみる – qiita。そろそろデータサイエンティストの定義とスキルセットについて本気で考えてみる。

データサイエンティストってなんだろう。掲題の通り、昨今色々と言われてるデータサイエンティストなる職業について考えてみる。業界にいてもこの職種はとかく定義が曖昧で、統一的な見解がない。なお、普段からデータサイエンティストについて考えている諸氏にとっては目新しいことは特に書いてないかもしれない。どちらかと言えば、データサイエンティストってどうやったらなれるんじゃい、もしくは流行りのデータサイエンティスト様を雇いたいけどどんな人採ればよいかのぅ って方々に見て欲しい記事なのでそのあたりはご了承願いたい。世間一般の見解を見てみる。とりあえず世の中に既にある有名な幾つかの定義の俗説を見てみることにする。”data scientist’ is a data analyst who lives in california”。カリフォルニアに住むデータアナリストをデータサイエンティストと呼ぶ。どっちも上手いこと言ってるようで、元も子もないという気もする。詳細は上記のリンクを読んで頂ければと思うが、要はハッキングスキル数学・統計学独自の強みの3つを備えたのがデータサイエンティストというわけだ。または、日本の専門協会が、データサイエンティストに必要なスキルを公式発表している。データサイエンティストの定義・スキルセット・スキルレベル。ワーディングはやや違うが、上記のベンダイヤグラムとよく似ている。その理由は次の2つだ。1 構造的でない。この記事では、この2つの問題を解決する形で、データサイエンティストのスキルセットを構造的に定義して見たいと思う。データサイエンティスト =マルチリンガル論。常々、データサイエンティストという概念はマルチリンガル多言語話者翻訳者に少し近いのではないかと考えていた。データサイエンティストは複数の異なる言語を巧みに操り、また言語間の翻訳が出来なければならない。ここで言っている言語とは、。・統計学/数式。などを指す。売上アップを目指せyoというが、それが具体的な数式やアルゴリズムとして語られることはない。統計家は難しい数式を扱うのが得意だが、それを現実のビジネスの出来事になぞらえて話すことが苦手だったりする。数式や数字の羅列をアウトプットしても、別の職種の人間は見向きもしない。もし仮に全てのプレイヤー計算機は除くががデータ分析やデータドリブンの重要性を理解していたとしても、上記のようなシチュエーションはよく起こるものだ。同じ日本語で話してるんだから通じるやろなどと思ってはいけない。立場が違えばそれぞれが使う言葉とその背後にある意味は全く異なる。この状態を打開するためにデータサイエンティストは存在する、というのがこの記事で論じたいデータサイエンティスト像の姿だ。それぞれの異なる言語の間を自由に行き来し、必要な場合は翻訳家となり、データ分析に関する一連のバリューチェーンを飛び回る便利屋となる必要がある。分析のバリューチェーンと読み書き。各プレーヤのセリフは多分に象徴化したかつ偏見を含んだものであり、各君子が日頃このような言葉ばっかりを発しているわけではない。図を挿入。ビジネスマネージャの期待に答えた内容になっていることも重要だ。使えるデータを精査し、悪さをするデータを除くなど実際に使うデータの範囲を決め、みる粒度について考え、必要であれば統計的なモデルを設計する必要がある。結果をどのような図表で見せるかも考えておかなければならない。エンジニアの人。分析家の考えた計算ロジックを実装する。計算インフラ。データ量によるが、計算リソースや並列化などのチューニングのために、インフラエンジニア的な知識を持った人材が必要になることもあるだろう。基本的にこれら全てのスキルを1人の人間に求めるのは、酷というかほぼ不可能に近い。それはさておき、ビジネスプロセスは書いて、つまり分析してその結果を読むプロセスが重要だし、かつ面白い。先ほどと同じように書くと下記のような感じだろうか。統計モデルを自分で組めなくても、入力したデータの構造とモデルの結果の読み方がわかっていればよい。kpiを設計するのは半人前でも、各KPIの数値を読み解き、ビジネス的な解釈と仮説の立案ができれば良い。大体この表で書きで2個くらいに強みがあり、それ以外は読みができるのであれば、データ分析プロセスに関わる人間としては十分強力なのではないかと思う。強調したいことは、。全部の分野を書ける必要はない。書けない言語も読めれば ・∀・イイ。先程も述べたとおり、英語だろうがレバノン語だろうが、読みは書きよりも易しい。無理にwriting/speakingまで行かず、reading/listeningできるようになることが第一。そして自分が書ける言語の会話であればよりイニシアティブを持って会話に参加すればいい。完璧なクアトロリンガルは無理だと思う絶望。でもバイリンガル + 2か国語 読み聞きできる程度ならなんとかなりそうだし、それでも結構役に経つから頑張ろうぜ。ってことです。PhD持ちで、spark,hadoop,sqlあたりは当然に使えて、pythonが分析のみならずプロダクトに組み込むアルゴリズムの構築レベルでかけて、統計モデルと機械学習の知識が豊富で、ビジネス経験が十分で、チームマネジメントに長け、コミュニケーションの高い人 募集みたいな馬鹿げたデータサイエンティスト求人がこの世からなくなりますように。enjoy。データサイエンティストに興味があるならまずこの辺りを見ておきな、って文献・動画のまとめ。http://。*エンジニアよりも統計学に優れ、統計家よりもエンジニアリングに優れた人種のこと*。***”the data science venn diagram”***。**一つづつ説明しよう。一般的に **書きのプロセスのほうが読みよりも難易度が断然高い** ことが多い。よって書きのスキルをフルスタックで持った人間を”データサイエンティスト”と定義してしまうと、この職種は**あっという間に詰んでしまう**。つまり言い換えれば、**名乗りたければデータサイエンティストを名乗っても良いんじゃね**ということだ。##終わりに。ツイートhik01074633contribution。人気の投稿 pythonでデータ分析するのに必要なツールのまとめ pythonで美しいグラフ描画 -seabornを使えばデータ分析と可視化が捗る その1 データサイエンティストに興味があるならまずこの辺りを見ておきな、って文献・動画のまとめ随時追加 python pandasでのデータ操作の初歩まとめ − 前半:データ作成&操作編 pythonでpandasのplot機能を使えばデータ加工からグラフ作成までマジでシームレスanization。

関連書籍

//rcm-fe.amazon-adsystem.com/e/cm?lt1=_blank&bc1=000000&IS2=1&bg1=FFFFFF&fc1=000000&lc1=0000FF&t=trubetzkoy-22&o=9&p=8&l=as4&m=amazon&f=ifr&ref=as_ss_li_til&asins=4798041084&linkId=dbca5d0463713a1e5f0416e5861c011a

参考記事

そろそろデータサイエンティストの定義とスキルセットについて本気で考えてみる – Qiita

広告

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中