在宅ワーク・内職の求人・アルバイト情報なら主婦のためのママワークス

データ分析のスペシャリスト「データサイエンティスト」とは?役立つ資格など紹介!

近年急速にIT技術が発展し、ビッグデータを用いた企業活動も増えてきました。そんな中注目されているのが「データサイエンティスト」という職種です。あまり聞きなれない方も多いと思います。元々サイエンティストは英語で、【scientist】=科学者という意味です。データを用いた科学者、すなわちデータ分析・活用のスペシャリストを「データサイエンティスト」と呼びます。「データサイエンティスト」になるには、どんな資格やスキルがあれば役に立つのでしょうか?仕事内容なども詳しく見ていきましょう。

目次

データサイエンティストとは?

「データサイエンティスト」は、データの収集・分析の専門家です。企業が持つ膨大なビッグデータを分析・解析し、それを企業の事業戦略や課題解決につながる情報として提供する、プロフェッショナルな人材を指します。元のデータは、分類にばらつきがあるなど整理されていないことも多く、そういった不完全なデータを専門的なスキルで抽出したり整形したりする作業も必要です。統計解析に関する知識はもちろん、データベースやプログラミング言語、ビジネスそのものの理解、機械学習や市場トレンドなどの幅広い知識が要求される、レベルの高い専門的職種と言えるでしょう。一般社団法人データサイエンティスト協会では、データサイエンティストのミッションを「データの持つ力を解き放つ」と、定めています。

データサイエンティストの仕事内容

データサイエンティストとして求められている役割は、企業によって異なることもあります。分析に特化したスペシャリストもいれば、データ活用に関わる業務全般を幅広く担当しているケースもあります。一般的には、以下のような職務に当たることが多いでしょう。

① 問題定義
ビジネス上の課題に対して、データ分析で解決したい事柄を設定します。自社の課題であることも、顧客の課題であることもあります。

② データの収集・整理・保存
統一性がない大量のデータの収集をし、それらの情報をより利用しやすいフォーマットへ変換をしたり、不要な部分をカットしたりして、扱いやすく整えます。

③ データの分析・解析
専門的分析手法に沿って収集したデータを分析し、大量のデータから課題解決につながるようなポイントを見つけ出します。

④ 課題解決・提言を盛り込んだレポート作成
分析したデータを整理し、得られた知見から必要なアクションを決定し、提案レポートを作成します。図やグラフィックを用いて、ITに詳しくない顧客にも提言をわかりやすくすることも必要です。

データサイエンティストが持っていると役に立つ資格

「データサイエンティスト」は、ITのスキルからビジネスの知識まで、様々な専門的な知識やスキルが必要な仕事だとわかりました。では、「データサイエンティスト」になるのに必要な資格があるのかというと、必ずしも必要な資格はありません。しかしながら、資格があれば、職務上必要になる知識を有しているという証明になるので、資格を持っていることは決して無駄なことではありません。また転職の際には、アピールポイントになったり、他の求職者との差別化になります。データサイエンティストは、どんな資格があれば、役に立つのか順番に見ていきましょう。

【国家資格】
以下でご紹介する3つの資格は、すべて独立行政法人情報処理推進機構(IPA)が実施し、経済産業省が認定するIT系では数少ない国家資格です。

■基本情報技術者試験(FE)
IT系技術者を目指す人がまず取得したい基礎的な資格と位置付けられています。ITに関する基本的な知識や技能を持ち、実践的な活用能力が身についているかを認定します。合格には、情報処理の基礎理論、プロジェクトマネジメント、SQL(データベース)など幅広い知識が必要です。エンジニアなどIT系の多くの職種で役に立つ資格ですので、令和元年には約17万人もの人が受験し、合格率は25.7%でした。

■応用情報技術者試験(AP)
基本情報技術者試験(FE)に合格した人が、次に取得を目指すのは、応用情報技術者試験(AP)です。合格すれば、技術はもちろん管理や経営まで幅広い知識と応用力が身に付いていることを証明し、高度なIT人材として重宝されるでしょう。令和元年には約10万人が受験し、合格率は22.3%とこちらも難関な試験です。記述式の設問があり、より高度な知識と深い理解が必要となります。

■データベーススペシャリスト試験(DB)
データベースの設計や運用管理に特化した、専門的な知識を持つスペシャリストとして証明される国家資格です。情報分析やプロジェクト管理など、一般的なデータベースに関する知識が問われます。「応用情報技術者試験(AP)」よりさらに上位の試験であり、平成31年度の合格率は14.4%と最難関レベルの試験です。午前に4択式の問題が出題され、午後には記述式の問題が出題されます。

【民間資格】
一般企業が独自に制定している資格で、IT業界においてリリースされている製品・サービス・ソフトウェアなどの知識や技術を認定するものです。

■オラクルマスター
オラクル社製品の「Oracle Database」の管理スキルを証明する資格として、延べ26万人もの技術者が受験してきたIT業界では有名な資格です。2020年1月以降に実施される試験から新資格体制となり「Bronze DBA」「Silver DBA」「Gold DBA」「Platinum DBA」「Silver SQL」の5つとなりました。2020年10月の時点で「Platinum DBA」の詳細は発表されていませんので、現状受験できるのは「Platinum DBA」を除く4つとなります。

新資格体制前はBronzeから順に資格を取っていく必要がありましたが、新資格体制ではBronzeの取得は任意となり、Bronze資格なしでもSilverが受験できるようになりました。またGoldの受験の要件であった、要履修のコースがなくなり、Gold受験に必要な試験数が4試験から2試験に減り、受験しやすくなりました。全国にあるピアソンVUE社テストセンター、またはオンラインで受験できます。

■OSS-DB技術者認定試験
特定非営利活動法人エルピーアイジャパン(LPI-Japan)が、オープンソースデータベース(OSS-DB)に関する技術力と知識を、中立的な立場で認定するIT技術者認定資格です。データサイエンティストに必要なデータベースの設計、開発、運用などの技術があるかどうかを判断します。認定を受ければ、オープンソースデータベース、特にエンタープライズ・システムで多く活用されている「PostgreSQL」に関する客観的な技術力の証明になります。「Silver」と「Gold」の2つのレベルがあり、まずSilverを取得することで、Goldの受験資格が得られます。

■Python3 エンジニア認定データ分析試験
一般社団法人Pythonエンジニア育成推進協会が実施している試験であり、Pythonを使ったデータ分析の基礎や方法を問う試験です。プログラミング言語のPythonは、データの整形・整理や機械学習など幅広い用途で使用できるため、データサイエンティストは実務でも必要になる言語でしょう。試験の内容は、初心者向けの基礎的なもので、合格率は78%と難易度はあまり高くありません。

【公的資格】
国家資格と民間資格の中間に位置づけられる資格で、民間団体や公益法人が実施し、官庁や大臣が認定する資格です。認定しているのは国なので、社会的信用は高いものになります。

■統計検定
日本統計学会が実施する「統計検定」は、統計に関する知識や活用力をはかるための試験です。データに基づいて客観的に判断し、科学的に問題を解決する能力は、データサイエンティストには不可欠なものです。難易度によって1級~4級まで5段階に分かれており、2級は大学基礎科目レベル、準1級は「統計学の活用力 ― データサイエンスの基礎知識」となっているので、データサイエンティストなら是非準1級合格を目指してみましょう。合格率は準1級で約30%となっています。

■G検定・E資格
一般社団法人日本ディープラーニング協会が実施している認定資格で、機械学習や人工知能の知識を習得することができます。事業活用する人材(ジェネラリスト)と、ディープラーニングを実装する人材(エンジニア)の育成のための試験です。日々進化・進歩する技術であることから、検定・資格実施年毎に実施年号を付与されます。

G検定は、ジェネラリストのための試験で、ディープランニングの基礎知識が問われます。E資格は、ディープラーニングの理論を理解し、実装する能力や知識が身についているかを認定するエンジニア向けの資格です。E資格の受験には「JDLA認定プログラム」を過去2年以内に修了していることが必須条件になっています。このプログラムはディープラーニングを理解し、適切な手法で実装できるように基礎的な内容を学ぶものです。大学での講座やオンライン授業に参加したりすることで、認定プログラムを受講することができます。合格率は2019年度に開催したもののデータでは、G検定が72.8%、E検定が63.3%となっています。

データサイエンティストに必要な知識とスキルセットとは

ここまでデータサイエンティストが持っていると役に立つ資格について見てきましたが、実際には資格の有無よりも、実務に必要な知識やスキルが身についているかどうかが重要になります。それではどういった知識やスキルが必要になるのでしょうか。

データサイエンティスト協会は、データサイエンティストに必要とされるスキルセットを以下の3つの力と定めています。

① 「ビジネス(business problem solving)力」:課題背景を理解した上で、ビジネス課
題を整理し、解決する力
② 「データサイエンス(data science)力」:情報処理、人工知能、統計学などの情報科
学系の知恵を理解し、使う力

③ 「データエンジニアリング(data engineering)力」:データサイエンスを意味のある
形に使えるようにし、実装、運用できるようにする力

【ビジネス力】
・コミュニケーションスキル
チームメンバーと協力して円滑にプロジェクトを進めていくため、コミュニケーション力は重要です。また正しく目標設定するために、クライアントの課題を正確に抽出するヒアリング力も大事ですね。

・ロジカルシンキング
目標を定めるため、問題を解決するための論理的な思考力が必要です。また、分析したデータを元に、課題解決のためのアクションを決定する問題解決能力も大事になるでしょう。

・プレゼンテーションスキル
データサイエンティストが分析した結果を元にしたビジネス提案などは、レポートやプレゼンテーションでクライアントなどにわかりやすく伝える必要があります。ITに詳しくない方が担当の場合も多いですので、難しい言葉を使わず、わかりやすく伝えるプレゼンテーションスキルも大事になるでしょう。

また、ビジネス戦略やマーケティングに関する知識があれば役に立つでしょう。

【データサイエンス力】
・分析や統計学の知識
収集したデータを分析し、そのデータをどう課題解決に役立てられるかを考えるのがデータサイエンティストの重要な職務ですので、統計学に関する知識は必ず必要になります。また、データマイニング(DM)と呼ばれる、統計学、パターン認識、人工知能等の分析手法を用いて、大量のデータに網羅的に適用することで知見を取り出す技術も必要です。

・機械学習についての知識
人口知能(AI)が自律的に物事を学ぶための技術が機械学習です。膨大なデータを用いることで、機械自身が特徴やルールを学習していきます。機械学習の知識があれば、分析基盤を構築するエンジニア領域の業務にも従事することができます。

【データエンジニアリング】
・プログラミングスキル
プログラミング言語は、「Python」か「R言語」のどちらかがデータ解析の場面では使われることが多いです。「Python」は、先の資格の項目でも紹介しましたが、データの整形・整理や機械学習など幅広い用途で使用できます。構文がシンプルでわかりやすいため、学びやすいプログラミング言語と言えます。「R言語」は、オープンソース・フリーソフトウェアの統計解析向けのプログラミング言語のことですが、現状多くの企業で「Python」を使われていますので、まずはこちらから身につけたほうが良いでしょう。

・データベースに関する知識
先に資格の項目で紹介したように、膨大なデータを効率よく処理できるようデータベース設計することが求められていますので、データベースに関する知識は必ず必要になります。大量のデータを扱うため、適切なデータ設計をしていないと、サーバーに負荷がかかります。最悪の場合サーバーがダウンしてしまい、他のビジネスにも影響を及ぼすこともあります。

・ビッグデータに関する知識
データサイエンティストが扱うデータは、一般的なデータではなく、大量のデータが集まっているビッグデータと呼ばれるものがほとんどです。目標とする課題解決のために、どのような場所から、どのようなデータを抽出するのか、ビッグデータを使いこなす技術が必要になります。「Hadoop」や「Apache Spark」に代表される、ビッグデータ分析に最適なオープンソースの分散処理フレームワークの知識が必要でしょう。

データサイエンティストになるには

データサイエンティストになるためには、幅広いスキルが必要になることがわかりました。それでは、データサイエンティストを目指したい!という人は、まずどこからスタートすればいいのでしょうか?

これからIT業界に身を置きたいと考えている初心者の方は、まずはプログラマーやシステムエンジニアを目指しましょう。そこである程度の実務経験と知識を得たら、「データベースエンジニア」を目指すのがおすすめです。データベースエンジニアとは、データベースの開発・設計・運用・管理を行うエンジニアのことを指し、データサイエンティストとしても必須になるデータベース系の言語を身につけることができます。また、機械学習・ディープラーニングなどの知識は独学するか、スクールに通って身につけましょう。ビッグデータを効率的に解析するデータベースを作成するスキルがあれば、データサイエンティストでも必ず役に立つでしょう。

他には、「データエンジニア」や「Pythonエンジニア」「Webプログラマー」など、エンジニアからのキャリアパスとして「データサイエンティスト」を選ぶケースもあります。

また、IT業界以外からでも、コンサルタント、データアナリストやマーケター、数理統計を扱う職種からデータサイエンティストへの転身も一般的です。こういったビジネス系の分野を得意とする、ビジネス寄りのデータサイエンティストの求人も数は多くないですが存在するようです。SPSSやSASなど統計ツールをもちいた分析では、ITスキルがあまり必要とされない場合もあります。ただ、システム開発やプログラミング言語についても学んでおいた方が仕事の選択肢は広くなるでしょう。

データサイエンティストの年収

求人ボックスの給料ナビ(2020年9月)を参照すると、データサイエンティストの正社員の平均年収は約701万円となっています。日本の平均年収が440万円程度とされているので、それにくらべると高い水準の年収のようです。給料分布を見てみると、ボリュームゾーンは653〜753万円の水準ですが、全体の給与幅としては453万円〜1252万円と比較的広いため、持っているスキルや経験によって大きく差が出ることを表しています。

データサイエンティストは、アメリカでは、「今一番稼げる職業」とも言われていて、年収2000万円を超えることもめずらしくないそうです。日本では1000万円を超えれば、ハイクラスのデータサイエンティストと言えるでしょう。

ただし、データサイエンティストは比較的新しい職種なので、東京都内での求人がほとんどを占めているのが現状です。それでは、東京近郊以外に住んでいるデータサイエンティストはどうすれば高収入を得られるのでしょうか。それは、自分で会社を興すか、都内の会社から仕事をもらってフリーランスで仕事をする必要がありそうです。人出不足のIT業界ですから、業務委託で月50万円の案件などもあるようです。それを2軒請け負えば、フリーランスでも軽く年収1000万円を超えることができます。

データサイエンティストについてのまとめ

ここまでデータサイエンティストについて、役に立つ資格やスキルを中心に見てきました。データサイエンティストには、専門的な知識が幅広く必要になるため、簡単な仕事ではありません。しかし、ビッグデータ時代と言われる現代において、今後ますます必要とされる仕事であることはまず間違いないでしょうし、需要が低下する可能性も低いと思われますので、スキルがあれば安定して仕事をすることができるでしょう。データサイエンティストに興味を持った方は、まずは資格の勉強から始めてみてもいいかもしれませんね。

目次