ブログ

データ分析の手法5選!仕事に役立つ基本の手法をおさえよう!

原田千明 原田千明
2017-11-02 | データ分析

データ分析は、経営戦略の立案や業績の向上に欠かせないものとして多くの企業で積極的に取り入れられています。しかし、データ分析の重要性に気付いていながらも、有効にデータの活用ができている企業ばかりではありません。どんな情報を基に分析をし、得られた結果を何に利用するかによって最適な手法は異なりますから、目的に合った手法を選んで分析を行うことが大事です。ここでは、数ある分析方法のなかから基本の5つの手法について解説します。

データ分析は普段の業務で使うもの?みんなの職場ではどうなの?

まずは、どれくらいの職場でデータ分析が行われているかを知るためにアンケートを取ってみました。

【質問】
あなたの職場では普段からデータ分析を業務に取り入れていますか?

【回答結果】
はい : 60
いいえ : 40

【アンケート概要】
調査地域:全国
調査対象:【年齢】20 – 29 30 – 39 40 – 49 50 – 59 60 【職業】パート・アルバイト 個人事業主 公務員 正社員 派遣社員 経営者
調査期間:2017年08月29日~2017年09月05日
有効回答数:100サンプル

データ分析を行っているのは約6割

今回のアンケートでは、自分の職場でデータ分析を行っていると答えた人は全体の6割という結果でした。

・1ヶ月に1回ずつ市場調査や、売れ筋などを集計してデータ分析を行い、データをもとに業務を行うようにしている。(30代/正社員/女性)
・医療機関で働いています。毎日の患者数の把握は人員配置の目安や、薬や診療材料の購入の際の重要なデータとなります。(40代/正社員/女性)
・会社のホームページを訪れる人のデータ分析を行い、閲覧数の増加に生かしています。どのような人が、どのコンテンツに興味を持っているか、訪れる時間帯や曜日などのデータも調べています。(50代/正社員/男性)

データ分析を業務に取り入れていると回答した人のコメントを見ると、販売促進や作業効率の向上を目的としたデータ分析が多いようです。データを分析することによってトレンドをつかみ、それを仕事に活かしているという回答が目立ちました。一方、データ分析を取り入れていないと回答した人のコメントは以下の通りです。

・単純作業なので多分、私の関わる所ではとりいれてないと思います。(40代/パート・アルバイト/女性)
・ほとんどデータ分析は取り入れていません。小さな会社なので、あまり大きな影響がありません。(40代/経営者/男性)
・特にデータ分析が必要な職種ではないため。(20代/正社員/男性)

データ分析を取り入れていないと回答した人のコメントを見ると、データ分析をしないのは職種や会社の規模がデータ分析を必要としていないためという回答が目立ちました。また、会社全体の業務が見えず、データ分析を行っているかどうかがわからないため、取り入れていないと回答した人もいるようでした。

全体的にデータ分析を取り入れているところが多いようでしたが、アンケートの結果からは、ただ情報を集めるだけで、きちんとした分析ができていない企業もあるように感じられました。では、基本的なデータ分析の手法を順に紹介していきます。

データ分析の初歩!クロス集計

クロス集計とは単純集計の次に基本的な集計方法です。性別や年齢など属性別に集計を行う手法で、複数の質問に対する答えの相関性を分析することができます。さまざまな軸を設けることによって、調査目的に合った情報を引き出せるのもクロス集計の特徴です。単純集計の内容を詳しく分析する際に用いられる手法で、カテゴリー×カテゴリー、数量×カテゴリー、数量×数量の3パターンの分析が可能です。たとえば、カテゴリー×カテゴリーのパターンを使うと、どんな商品を同時購入しているかを分析するときなどにも使えます。統計にそれほど詳しくない人でも理解しやすい分析方法で、年齢別に好まれている商品を調べたいときや、属性ごとのトレンドをつかみたいときに有効です。

発生確率の予測に!ロジスティック回帰分析

ロジスティック回帰分析とは、多変量解析法のひとつで、量的変数から質的変数を予測する分析手法です。二値論理に関する成果を分析するときに用いますが、予測変数の値が1になるか0になるかを予測するのではなく、目的変数が1になる確率を予測します。目的変数として用いられるのは比率データや質的データで、リスク因子によって病気が発症する確率の分析や、マーケティングに関する分析などに使われることが多い手法です。たとえば、リスク因子ごとに病気を発症させる確率が違う場合、それぞれの因子が病気の発症にどれくらい影響を与えているかは、オッズ比をチェックするとわかります。オッズ比とは、病気が発症する確率と発症しない確率の比のことです。

関連性の発見に役立つ!アソシエーション分析

アソシエーション分析は、POSシステムのデータ分析用に開発された比較的新しい分析手法です。膨大な量のログデータのなかから関連性のあるデータを抽出するために開発されました。ある条件を与えたときに、ある決まった結果が起こる確率を調べるのがアソシエーション分析です。具体的には、タバコを買う人が缶コーヒーも買う確率はどのくらいかというようなことを分析するのですが、缶コーヒーとタバコが逆になったときの確率が異なるという点がアソシエーション分析の特徴です。商品AとBを同時に買う組み合わせの出現率をsupport(支持度)、商品AとBの関連性の強さを表す指標をconfidence(信頼度)、全体のなかでAとBを購入した人の割合をlift(リフト値)で表します。

リスクマネジメントに使える!決定木分析

決定木分析は、ディシジョン・ツリーとも呼ばれる分析手法で、アンケート結果などを基に樹形図もしくはツリー構造と呼ばれる図を作り、分岐点ごとにクロス集計を繰り返して偏りが最も大きくなる分岐条件を見つけ出します。たとえば、年齢別、性別などの項目で樹形図を作り、どのような属性の人が最も製品の購入をしているかを探ることができます。しかし、マーケティングだけでなく、物事を整理するのにも便利な方法です。故障などリスクが最も高くなる要因を見つける際に用いやすい分析手法のため、リスクマネジメントに活用されるケースも目立ちます。分析途中は何を分析しているのかがわかりにくい手法ですが、先入観を持たずに複雑なデータを自動的に整理していけるという強みがあります。

顧客セグメント絞り込みに役立つ!クラスター分析

クラスター分析のクラスターとは房や群れなど似た性質のものがたくさん集まった状態を意味します。多種雑多なものが混ざり合ったなかから、性質が似ているものを集めてクラスターを作り、その特徴を分析します。そのため、どのような条件で似たものの集団をつくるかが決め手になります。クラスター分析は、あらかじめどのような分類をするかという基準が決まっていないため、何を基準にクラスターを作ることかを考えるのが大変です。しかし、クラスターが決まれば、自動的にデータが集まります。階級クラスター分析と非階級クラスター分析があり、階級クラスター分析では一度クラスター別に分けたものを必要に応じて結合させることが可能です。一方、非階級クラスター分析を行う際には、クラスターをいくつに設定するかが非常に重要なカギを握ります。

分析手法は多すぎる… だからこそ基本が大事!

データの分析手法は多くあるものの、一般的に用いられている分析手法は限られています。ですから、まずは基本の5つを押さえておくようにしましょう。基本的な5つの分析手法がわかれば、スムーズに分析を始められます。ただし、それぞれの分析手法の特徴を正しく理解したうえで、目的に合った方法を選ぶことが大事です。分析によって何を知りたいのか目的がはっきりしたら、必要なデータを集め、適切な手法を選んで実際に分析を行ってみましょう。

詳しくは、「ビジネスパーソンに不可欠なデータ分析!手法と手順を徹底解説」をご参照ください。

ビジネスに特化したオンラインストレージ、ファイル管理ツールなら「Fleekdrive」