【Tableau】コーヒーを分析して見ました。




Sponsored Link

Tableau Data Saberについて

Tableauとは、ドラッグ&ドロップで簡単に指標の可視化を行える、ビジネスインテリジェンスツールです。

僕は今、Tableau社から提供されているData Saber プログラムに会社で参加しているところで、Tableauの勉強をしています。

そこで、今回はTableauを使ってよく行くコーヒー屋さんのコーヒーを分析してみたので、その結果をシェアします。

コーヒーを分析するために

コーヒーをTableauで分析するために、様々なコーヒー屋さんから情報を集めてきて、一つ一つ手動でExcelに追加しました。マジ大変だった…

今回データソース に含めた指標は以下の9つです。

  1. Country
  2. Price
  3. Altitude
  4. Volume
  5. Flavor
  6. Roast
  7. Shop
  8. Variety
  9. Process

Flavorについては、SCAA(Specialty Coffee Association of America)が出している、Flavor Wheelの一番大きいカテゴリーを用いて分けました。

また、Roastについては一般的なシナモン、メディアム、シティ、フルシティ、フレンチと分け、フレーバーとの相関を期待しました。

Varietyが複数ある場合は書かれている品種のうち左側のもの、または配分が多いものを採用しました。

ProcessはWashed, Semi Washed, Natural, Anaerobicでわけ、Double Anaerobic、パルプドナチュラルなどは近いもの(この場合はそれぞれAnaerobicとSemi Washed)に分けました。

作ったVizと分析

それでは、作ったViz(可視化したグラフ、ダッシュボード)を共有します。

ちなみに、こちらから触れるようになっているので、ぜひ見てみてください!

国とフレーバーの関係

国とフレーバーの関係

まず、1枚目です。国とフレーバーの関係を地図上にプロットしました。

円グラフを利用してどの国がどんなフレーバーがあるのか可視化しました。

本来円グラフはものを比較するために使うのですが、細かな差がわからなかったり、幅をとるのでTableauではあまり推奨されていません。
しかし、今回は68個しかデータを取らなかったため、フレーバーの割合は気にしていません。そのため何種類のフレーバーがあるか可視化するために円グラフを用いても良いかなと思い採用しました。

このグラフから、ケニアやエチオピア、中南米、インドネシアにフレーバーの多様性が見られました。

あくまでも68個の中での分析なので、世界中のコーヒーショップのデータを集めることができれば、また結果は変わってくるのかなぁと思います。

そんなデータ欲しかった。

標高と価格の相関

標高と価格の相関

続いて、生産農園の標高と価格の相関を調べました。

こちらは、散布図を用いて可視化しました。

丸を見るとそこまで相関がないように思えましたが、傾向線を利用すると、少しは相関が見られるかもしれない、と言うことがわかりました。

一つ飛び抜けているのは、Starbucks Reserveのスマトラ クリンチでした。

標高が高いけれど大量生産できるから安くなるのですかね…

作り方とフレーバーの相関

作り方とフレーバーの相関

こちらはヒートマップを用いて作りました。

Publishした後に気づいたのですが、2以上に絞ればよかったと思ってフィルターをかけました。

結果がこちら。

作り方とフレーバーの相関2

最初はもっといい方法あるかなあと思っていたのですが、フィルターした瞬間ぱっと見わかりやすいVizになりました。

ここからわかることは、NaturalのCinnamon Roastが一番フルーティーなコーヒーになりやすいこと、精製方法によらず、浅煎りにするとフルーティーなコーヒーになりやすいことがわかりました。

また、Semi WashedのFull City Roastがスパイシーなコーヒーになりやすいことがわかりました。

価格と品種の関係

価格と品種の関係

これはとても腑に落ちる結果でした。

ゲイシャ種はコーヒーの中でも希少な品種で、データからも1番高価とわかります。

ちなみにゲイシャ種が希少な理由は、育てにくいと言うこともありますが、葉と葉の間隔が広いので一本の木から収穫できるコーヒーチェリーが少ないためです。

品種、プロセスと価格の関係

品種、プロセスと価格の関係

こちらはあまりインサイトが得られませんでした。

色の詳細はこちらです。

凡例

飛び抜けているのはwashedのエチオピア ゲイシャです。高い。

品種、プロセスと価格の関係2

難しいので全体の平均線と、それぞれの平均をリファレンスラインにして、下部を塗りつぶして表現して見ました。

これを見ると、castillo, geisha, catuai, heirloom, SL28, typicallyが比較的高いことがわかりました。

個人的には、ブルボン種が平均以下だったのがびっくりでした。

まとめ

いかがでしたでしょうか。

個人的にこの分析はとても楽しくできました。

flavorの色はもっと考えてつけるべきだったなぁ…Floralが青なのはなぁ。

楽しんでもらえると嬉しいです。

次回は日本の家を分析しようと思います。


コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です