「『はたらく』を通じて人生の可能性を広げるインフラをつくる」をミッションに、スキマバイトサービス「タイミー」を運営する株式会社タイミー。あらゆる事業活動でデータに基づく意思決定を重視する同社は、全社データ基盤においてクラウド型データウェアハウス(DWH)のデータ変換ツール「dbt(ディービーティ)」の活用を2021年に開始しました。dbtを利用するエンジニアが増加する中、2024年にはSaaS版「dbt Cloud」の最上位プランを導入し、現在は30名以上が利用しています。dbtの採用理由や活用について、エンジニアリング本部 データエンジニアリング部の土川さん、筑紫さん、大河戸さんにうかがいました。
データの規模やチームが大きくなるにつれ変換処理の要件が増加
労働市場で慢性的な人手不足が続く中、「スキマ時間のマッチング」という発想で2018年に誕生したタイミー。テレビCMによる認知度向上もあいまって瞬く間に人気サービスに成長し、2024年4月末で導入事業所数は25.4万拠点、累計ワーカー数は770万人を突破しました。現在も右肩上がりで成長を続け、2024年7月に東京証券取引所のグロース市場へ新規上場を果たしています。
事業成長を続けるタイミーでは、データに基づいた意思決定を重視して事業運営を行っており、「データを使うのは当たり前の文化がある」と土川さんは語ります。
同社が全社共通のデータ基盤を構築したのは2019年のことでした。当初は社内のデータをDWH(BigQuery)に転送するツールとしてオープンソースのEmbulk(エンバルク)を利用し、ETL(抽出→変換→ロード)の順で処理していました。しかし、データの規模やチームが大きくなるにつれて変換処理の要件が増加し、様々な課題が生まれていました。
「データの転送種類が増えるにつれて、加工に時間がかかるようになりました。データソースによってEmbulk以外の転送ツールを使うケースも増え、開発・管理コストの増加につながりました。変換処理はEmbulkのコードで管理されていたため、加工の内容が外から見えにくかったり、障害時のデバッグが難しかったりといった負債もたまっていました」(土川さん)
dbt Cloudの利用者拡大によりすべての機能が利用できる最上位プランを採用
課題の解決策として、同社は転送中に加工処理を行うのではなく、転送後に行うELT基盤(抽出→ロード→変換)を構築し、変換処理を独立して実装・実行する構成を目指しました。そしてELTに対応する5つのサービスを検討した中からdbtを採用しました。決め手は、高可用性の構成が組めることと運用コストにありました。
「データ変換を複数ステップで行うことから、DAG構成が組めることを重視しました。また、当時は2人のチーム体制だったこともあり、運用・導入コストも重視しました。さらに事例の豊富さ、コミュニティの活性度、将来性なども加味して決めました」(土川さん)
同社がEnterpriseプランに切り替えた理由を筑紫さんは「dbtの活用が社内に浸透したことにある」と説明します。
「2024年7月現在、すべての操作ができるEnterpriseプランのAdminライセンスと、閲覧のみ可能なViewerライセンスも含めると、DREチームとアナリストチームのエンジニア、データサイエンスチームの一部のアナリストあわせて30名以上が利用しています。Enterpriseプランに切り替えた理由のひとつは権限の管理です。利用者が増えていく中、ロールベースでアクセスをコントロールする狙いがありました」(筑紫さん)
アップデートが早く最新トレンドがスピーディーに取り込まれていくのがdbt Cloudのメリット
現在、同社のデータ基盤はBraze、Zendesk、Salesforce、GooglePlayなどのカスタマー関連のデータ、Adjustのマーケティングデータ、Timeeから得られる各種データ、Datadogのシステムログ、Google Analyticsの属性データや行動データなどのデータソースを、データ抽出ツールを介してデータプラットフォーム上のデータレイクに蓄積し、dbt Cloudで変換処理を行っています。DWH上のデータは、営業チーム、マーケティングチーム、データサイエンスチームなどがLooker を利用して分析したり、可視化したりしています。データ基盤は、データソースから、抽出、変換、BIツールまでは原則としてSaaSを活用してアーキテクチャを構成し、初期コストや運用コストの軽減を図っています。
「費用対効果やスピードを重視して、SaaSを積極的に採用するのがDREチームのポリシーです。dbt CloudについてもSaaSであることからアップデートが早く、データエンジニアリング領域の最新トレンドがスピーディーにdbtに取り込まれていくため、最新の技術トレンドに乗りやすいのが一番のメリットです」(土川さん)
BIツールは原則としてLookerを活用し、ITに詳しくないサービスチームの誰でも利用できるようにしています。SQLクエリーを作成してデータを可視化したいユーザーはLooker Studioを利用して各自が見たいデータを自由な切り口で見られるようにしています。
DevelopersIOでdbtの技術情報や最新情報を入手
「これまでデータサイエンスのチームは、DWHのBigQueryに直接SQLでアクセスすることしかしてきませんでしたが、dbt Cloudが浸透していくにつれて、モデル化し一元管理できる形で可視化する動きが出てきました。それにより、社内のデータ活用レベルを一段階高めることができました」(筑紫さん)
最新の機能が日々アップデートされていくdbtを活用するうえでは、クラスメソッドのDevelopersIOを参考にしています。クラスメソッドは、dbtの販売を国内で初めて開始したパートナーであり、販売から導入支援までをワンストップで提供しています。開発者やユーザー向けの情報はDevelopersIOで積極的に発信し、2024年7月現在、100本以上の記事を掲載しています。大河戸さんはアクティブにDevelopersIOにアクセスし、dbtに関して多くの知見を得ているといいます。
「DevelopersIOは、dbtの情報が充実しているので、最新の技術情報を常にチェックして参考にしています」(大河戸さん)
社内のあらゆるデータ抽出にdbtはなくてはならない存在
同社のDREチームがdbtを初めて導入してから3年、Enterpriseプランに切り替えてからは4カ月が経ちました。今後もdbtの活用レベルを高めながらデータ分析における課題を解決していく構想を明らかにしています。
従業員数が1,200名を超え、現在も増え続けているタイミー。事業のあらゆる意思決定に欠かせないデータ基盤は、今後も拡張と進化を続けていくことは間違いなく、クラスメソッドは様々なサービスの提供を通して支援を続けてまいります。
株式会社タイミーについて
株式会社タイミー採用情報
https://product-recruit.timee.co.jp/data