[Python]TenseorFlow入門から実装まで その2機械学習で重要なこと

[Python]TenseorFlow入門から実装まで その2機械学習で重要なこと

前回、TensorFlowの概略について簡単に説明しました。
早速、TensorFlowの使い方を説明していきたいところですが、今回は機械学習で重要なことをまとめていきます。

この記事は多少エッセイ風な内容になっていますので、
とりあえずTensorFlowを動かしてみたいって方はこの記事を飛ばして、
その3のTensorFlowのインストル方法の説明を読んでください。

日本においてAI:人工知能は幻滅期にある?

これからAIや機械学習を学んでいこうという方々に水を差すようなニュースですが、
最近、ガートナー・ジャパン株式会社から次のような報告がなされました。

https://www.gartner.com/jp/newsroom/press-releases/pr-20191031

人工知能
ブームは少し収まり、要するに、「人工知能スゲー」の時代は終わり、
「人工知能って意外と大したことないな。」と思われる幻滅期に入ったということです。

例えば、Google trendsという、ネット上の流行を調べるGoogleのサービスで「人工知能」と調べた結果を下に示します。

2016-2017年をピークに2018年中旬ごろからネット上での人気が下落しています。
だからといって、人工知能の勉強をやめる必要はないです。
しかし、人工知能の技術が期待に応えないときが多いのも事実です。

そこで、人工知能や機械学習で重要なことを説明します。

AIや機械学習で大事なことはデータである。

この見出しがこの記事の落ちですが、人工知能の開発で最も大事なのは、解析するデータです。
前回の記事でTensorFlowはGoogleが開発し、無償で公開していると言いました。

しかし、考えてみてください。
Googleという企業が、基盤となる技術やソフトをただの善意だけで無償で公開すると思いますか?

決してそんなことはありません。
企業ですからそこには確固としたビジネスモデルがあります。

TensorFlowをはじめとした、人工知能の分野ではアルゴリズムやソフトウェアはそこまで重要ではありません。
そのため、TensorFlowといった素晴らしいソフトを無償で公開することができます。
(世界中にいるアルゴリズムの開発者たちはとても偉大です。誤解がないために。)

一方で、人工知能をビジネスとして成立ために、アルゴリズムやソフトウェアよりも大事なものがあります。

それは解析データです。
大きなデータでは、ビックデータと呼ばれたりしますが、
小規模な解析の小規模なデータも含みます。
実際、Googleなどの企業が収集しているデータやデータ収集のノウハウなどは一切公開されていません。

筆者自身も、人工知能に一部関わっていますが、最大の労力をかけているのはアルゴリズムやプログラムの開発ではなく、
実用的なデータを入手し、もしくはデータを作り出すことに最大の労力と時間を注いでいます。

そのため、機械学習や人工知能を学習される方々に、口を酸っぱく言い続けていますが、
大事なのはデータです。

データの質が低ければどんなに頑張ったとしても、良い成果は得られません。

しかし、どのようなデータが必要かのノウハウはまだ十分に培われておらず、どこの企業や研究者も手探りで行なっているのが現状です。
もし、良いノウハウを得ることができましたら、ブログ等で共有していきたいと思います。

Pythonカテゴリの最新記事