レバレジーズ データAIブログ

https://analytics.leverages.jp/

インハウスデータ組織のあたまのなか

フィード

記事のアイキャッチ画像
沖縄でスパルタンに出場してきました!
レバレジーズ データAIブログ
はじめに こんにちは、データ戦略室のブライソンです。2025年11月15日に沖縄でスパルタンという過酷なレースが開催されました。そのレースに、レバレジーズのエンジニアたちと参加してきました。本記事では、レバレジーズのエンジニア・データAI組織における、職種の垣根を超えたチームワークと、共に挑戦を楽しむ企業文化に焦点を当ててご紹介します!今回、技術や仕事の話は一切出てきません! レバレジーズのデータAI組織は、レコメンドPJやデータ分析基盤刷新PJ、その他のPJにおいて、内部での連携が必須です。しかし、それに止まらず、他職種と仕事をすることも多いため、多種多様な職種の人と知り合いになり、今回のよ…
15時間前
記事のアイキャッチ画像
LLMの回答精度を上げる「RAG」とは? 処理フローと「ベクトル検索」の役割について調べてみた
レバレジーズ データAIブログ
はじめに こんにちは!レバレジーズのテクノロジー戦略室でデータエンジニアをしている佐々木です。 みなさん業務にAIを使っていますか?私はNotebookLMをよく使っています。 自分が指定した情報源から回答を生成してくれるので、信頼度が高いのがありがたいです。 レバレジーズでは、社内で使われている独自の用語を質問できるNotebookLMも提供されており、入社直後の先輩社員が話している言葉がわからない問題の強い味方です! NotebookLMのように、外部情報を読み込ませてAIをカスタマイズする技術を「RAG」といいます。 いつもお世話になっているのですが、「RAGって何?」と聞かれるとちゃん…
7日前
記事のアイキャッチ画像
CSV納品に“差分”を添える:Streamlitで軽量ミニアプリを作ってみた
レバレジーズ データAIブログ
はじめに ※本記事の内容は、筆者個人の見解を含みます。 こんにちは。レバレジーズのテクノロジー戦略室でデータエンジニアをしている内山です。 日々の業務には、「ここが少し楽になれば」「すぐ確認できれば」という小さな不便が潜んでいます。 そういう課題こそ、ちょっとした仕組みでサクッと解消できると嬉しいものですよね。 最近は、Pythonだけで Webアプリを作れる Streamlit という手軽な選択肢もあり、思いついた改善をすぐ形にできるようになりました。 今回紹介するミニアプリもそのひとつで、CSVデータの差分を自動で整理して表示することで、確認の手間をぐっと軽くするものです。大掛かりな開発で…
16日前
記事のアイキャッチ画像
20000件の求人からスキルグラフ作ってみた
レバレジーズ データAIブログ
こんにちは、レバレジーズテクノロジー戦略室で研究員をしている修です。 データ系職種の皆さんは「次に何を学ぼうかな?」「このスキルとあのスキルって、どう関係してるんだろう?」と思ったことはありませんか? 今回、そんな疑問を解決するために、約2万件の求人データセットを使って、スキル同士の関係性を「グラフ」として可視化し、「どのスキルが一番『ハブ』になっているのか?」という観点から分析してみました。 この記事でやること データと手法の紹介:どのデータを、どんな方法で分析したのかを簡単に説明します。 スキルグラフの作成:求人データから「スキルの相関グラフ」を作ります。 グラフ分析(中心性):作成したグ…
24日前
記事のアイキャッチ画像
自然言語だけでkaggleのチュートリアルやってみた
レバレジーズ データAIブログ
はじめに こんにちは!レバレジーズのテクノロジー戦略室でデータエンジニアをしている鈴木です。 半年くらい前に、kaggleのチュートリアル(タイタニックの問題)を、FastAPI MCP + Claude Desktopを使って、自然言語だけでやってみたので紹介します! 背景 Googleのイベントに参加した際に、Looker in Geminiの対話型分析をみて、クエリを書かなくても、データからインサイトを得られる時代が来るのだなと思いました。そこで、専門的な知識を要する機械学習も、自然言語である程度やれたら、もっと身近なものになって良いな~と思い、実験してみることにしました! 前準備 ka…
1ヶ月前
記事のアイキャッチ画像
LTVを正しく測るための生存時間分析入門
レバレジーズ データAIブログ
はじめに こんにちは、レバレジーズでアナリストをしている高津です。この度弊社の人材サービスにおける、顧客のLTV(Life Time Value)分析を行いました。本記事では、LTVの考え方とその算出に使用する生存時間分析という手法を紹介しようと思います。 LTV(Life Time Value)とは何か? LTVとは「顧客生涯価値」と訳され、一人の顧客がサービスを利用開始してから終了するまでの間に、その顧客がもたらすであろう利益の総額を指します。 LTVを算出することは、企業にとって以下のようなメリットがあります。 顧客の将来の利益を考慮することで、より正確な予算策定を行うことができる LT…
1ヶ月前
記事のアイキャッチ画像
技術ブログのファクトチェックをAI Agentに任せる
レバレジーズ データAIブログ
レバレジーズ株式会社テクノロジー戦略室の苑田です。 苑田が技術ブログのファクトチェックをするときによく使うツールを紹介します。 ⚠️この記事では、記事の内容をゼロから生成AIに作らせるのではなく、自分で書いた内容の検証や校正を効率化する方法を紹介します。 ファクトチェック 記事を書いていると、その情報が正しいのか最新なのかを確認したくなることがあります。 そのときは、以下のツールを使うと便利です。 Deepwiki MCP(OSSに関する情報) DeepResearch系(実際に使用されている記事に関する情報) ドキュメント系MCP(公式ドキュメントに関する情報) それぞれ説明していきます。 …
1ヶ月前
記事のアイキャッチ画像
アジャイルデータモデリング本の勉強会とワークショップをやりました
レバレジーズ データAIブログ
はじめに レバレジーズでデータエンジニアやってます、ゲンシュンと申します〜。 データエンジニアリングチームとデータアーキテクトチーム合同で「アジャイルデータモデリング 組織にデータ分析を広めるためのテーブル設計ガイド」の勉強会とワークショップを開催しました。 ディメンショナルモデリングって現代のDWH開発において必須の概念だと思いますが、レバレジーズではワイドテーブル構成を採用していたため実践する機会がありませんでした。せっかく良い書籍が出たので、事業がたくさんあるレバレジーズのデータ分析基盤なら各事業を実装や課題感を踏まえた議論が出来てより理解が深まりやすいんじゃないか?と思い、みんなに声を…
1ヶ月前
記事のアイキャッチ画像
モデル内部構造の可視化ツールNeuronpediaを触ってみた
レバレジーズ データAIブログ
はじめに こんにちは、レバレジーズで研究員をしている永安といいます。レバレジーズの研究員は最新の技術をキャッチアップしつつ事業に活かしていくことを目標に活動しています。 私は特にAIの安全性、説明手法をテーマに研究活動を行っています。 さて、みなさんMLモデルを学習した時に、そのモデルの動作を理解するためにSHAPなどを使うことがあると思います。近年、SHAPのような入力特徴量の寄与を超えて、モデルの内部構造を理解しようとするMechanistic Interpreterbilityという分野が発展してきました。今回はMechanistic Interpreterbilityに基づいた可視化ツ…
2ヶ月前
記事のアイキャッチ画像
LLMの回答精度を評価する仕組みを作ってみた
レバレジーズ データAIブログ
はじめに こんにちは、レバレジーズテクノロジー戦略室でAIエンジニアをしている安藤です。 今回は最近社内で急速に導入が進んでいるLLMの精度評価の仕組みの構築について記載します。 現状、この分野は知見も少ないので我々も手探り状態ではありますが何か参考になれば嬉しいです。 背景 & 課題 LLM回答精度評価の難しさ 最近のLLMの普及に伴い、レバレジーズでも続々と業務改善やプロダクトにLLMが利用されるようになってきました。LLM導入はもっぱらサードパーティが提供するAPIを利用することで完了するものが多く、技術的に簡単に導入できるため導入数は急激に増えていきました。 一方でLLMの厄介さは導入…
2ヶ月前
記事のアイキャッチ画像
BigQuery MLを用いたフリーテキストのカテゴリ分類
レバレジーズ データAIブログ
はじめに こんにちは! データエンジニアの森下です。今回はBigQuery MLからGeminiを使用したフリーテキストの分類についてお話しようと思います。BigQuery ML を業務で使うのは初めてでしたが、思ったより簡単に SQL から LLM を呼び出すことができ、業務への応用がしやすくなったと感じています。 BigQueryMLの概要 BigQuery MLは、Google CloudのBigQuery上で、SQLを使って機械学習モデルを直接作成・実行できる機能です。 通常、機械学習モデルの構築にはPythonを使って実装することが多いですが、BigQuery MLはデータアナリスト…
2ヶ月前
記事のアイキャッチ画像
システムをシンプルにするための攻めのリアルタイム推論導入 ―― SageMaker Endpointのscale to zero機能
レバレジーズ データAIブログ
はじめに レバレジーズで機械学習エンジニアをしている稲垣です。 現在、とあるシステムにレコメンド機能を導入するプロジェクトを担当しています。 その中で、システムにSageMakerの新しめの機能をうまく活用できたので、その紹介をしたいと思います。 ぶつかった課題感 今回担当したレコメンドの主な要件は以下でした。 レコメンドの更新頻度は日次でOK レコメンドを必要とするシステムAから、レコメンドサーバ(今回の開発対象)に日次でリクエストが来るので、そのリクエストに応じてレコメンドデータを返す レコメンドサーバの実装方法の大きな分類としては「バッチ推論」と「リアルタイム推論」の 2 つがありますが…
2ヶ月前
記事のアイキャッチ画像
DuckDB MCPを利用した、ローカル環境でのお手軽データ分析のすゝめ
レバレジーズ データAIブログ
はじめに はじめまして、テクノロジー戦略室室長の竹下です。現在、AI推進室として活動しており、今回こちらのブログにお邪魔して書かせてもらいました。Leverages Tech Blogでもいろいろ書いているので、そちらもぜひ見てください! 業務上、アンケートの分析だったり、そこからの示唆の分析などを行うことも多々あるのですが、そんな時に最近はDuckDBを利用しています。この記事では、DuckDB + DuckDB MCP + VSCode copilotを利用した自然言語で分析を手軽にできる環境のご紹介をしたいと思います。 DuckDBとは DuckDBとは、ローカル、シングルノードで動作す…
3ヶ月前
記事のアイキャッチ画像
1000件アノテーション&3ヶ月プロンプト泥試合で実現した、工数40%削減の候補者検索ツール
レバレジーズ データAIブログ
トンでも君 データ戦略室で室長兼データサイエンティストをしている阪上です。本日は会社にある非構造化データを宝の山に変えたボトムアップでの取り組みについて紹介したいと思います。最後にはプロンプトのサンプルも付録としてつけておりますので、参考にしていただけると幸いです。 なお、冒頭の画像は、今回作成したツールのイメージキャラクターで「トンでも君」です。私は社内で開発したツールにイメージキャラクターやユニークな名前を付けることをしばしば行います。今回は、宝物を見つける→トリュフは宝である→豚はトリュフを見つける→豚のキャラクターにするという思考回路です。 背景と制約 一昔前まで、お客様の仕事経験に関…
3ヶ月前
記事のアイキャッチ画像
データアナリストがソフトウェアテストを使ってデータ品質のテストをしてみた
レバレジーズ データAIブログ
こんにちは。データアナリストの田代です。 データを分析していて、「SQLのロジックは合っているはずなのに、集計結果にどうも違和感がある…」そんな経験はありませんか? 最近、まさにそのような課題に直面しました。システムから連携されるデータを使った分析で、原因のわからない数値のズレが見つかったのです。調査を進める中で、「データそのものの品質」に体系的に向き合う必要がある、という結論に至りました。 今回は、システムの内部が見えない「ブラックボックス」を相手に、どのようにデータ品質を検証していったのか、その際に役立った「ソフトウェアテスト」の考え方と具体的なアプローチについてお話しします。 はじめに:…
3ヶ月前
記事のアイキャッチ画像
事業予算策定のためのKPI予測モデルの運用
レバレジーズ データAIブログ
はじめに レバレジーズ、データ戦略室データアナリティクスグループの丸山です。 皆さんの事業部では、予算策定の時期にこのような課題に直面していませんか? 「来期の売上はこれくらい」という目標が、勘や経験則で設定されている トップダウンで決まった目標数字だけがあり、達成までの具体的な道筋が見えない 施策と予算がうまく連動しておらず、効果的なリソース配分ができていない 本記事では、こうした課題を解決するために構築した、KPIの連動性を考慮したKGI予測モデルと、それを用いたデータドリブンな予算策定のフレームワークについて説明します。 なお、企業における予算の区分はこちらのサイトで説明されている通り、…
3ヶ月前
記事のアイキャッチ画像
Claude Desktop + Obsidian + Kindle = 最強の読書要約環境が完成した話
レバレジーズ データAIブログ
はじめに こんにちは、データアナリティクスグループの丸山です。 私は業務で必要な知識を得るために定期的に書籍を読むようにしているのですが、読書をする上で以下のようなあるあるを皆さんも体験したことがあると思います。 本は読んだけど、内容を思い出せない かといってメモを取るのは面倒だ 書籍で得られた知識同士がつながらず、断片的なままになってしまう そんな悩みを、Claude DesktopとObsidianの組み合わせで解決することを試みました。今回は、この革新的な読書要約システムを紹介します。なお、今回のシステムはKindleでの読書を行うことを前提にしています。 Obsidianとは Obsi…
3ヶ月前
記事のアイキャッチ画像
AIコーディングツール比較:Kiro vs Claude Code レビュー
レバレジーズ データAIブログ
はじめに こんにちは。データ戦略室、アナリティクスグループの高津です。AIコーディングツールが次々と登場し、便利だと感じる一方で、正直どれがいいのだろうかと選択に悩まれている方も多いのではないでしょうか。 そこで今回は、AIコーディングツールとしては新しいAWSの「Kiro」と、Anthropicの「Claude Code」について、実際に同一タスクを実行して比較検証を行いました。 それぞれのツール紹介 Kiro KiroはAWSが2025年7月にリリースしたエージェント型統合開発環境です。従来のコーディングツールとは異なり、要件定義、詳細設計、タスクリストを段階的に作成した後に実装に着手する…
4ヶ月前
記事のアイキャッチ画像
半導体メーカーの生産管理職から転職して3ヶ月、データ戦略室で感じたこととこれから
レバレジーズ データAIブログ
はじめに こんにちは。データ戦略室、データアーキテクトグループの櫻井です。今回は、半導体メーカーの生産管理職からレバレジーズ、データ戦略室のデータアーキテクトとして中途入社し、3ヶ月が経過する中で感じたことについてお話ししたいと思います。私のバックグラウンドを振り返りつつ、データ戦略室での業務内容、そして今後挑戦したいことについても触れます。データ戦略室でもあまり前例のない経歴ですので、その点も楽しんでいただけたら嬉しいです。 前職での仕事内容 私は2022年3月に大学院を修了し、同年4月に半導体メーカーへ新卒で入社。生産管理部門に配属されました。業務を覚え、実践する中で充実感を得ていましたが…
4ヶ月前
記事のアイキャッチ画像
前処理ライブラリ、NVTabularを触ってみた
レバレジーズ データAIブログ
はじめに こんにちは!レバレジーズデータ戦略室、データサイエンティストのJacobです。 今回は、大規模データ処理に特化したPythonライブラリ「NVTabular」について書きたいと思います。 どの機械学習モデルにも前処理が必要です。データセットを訓練・検証・テストセットに分割する前の前処理もあれば、分割後の前処理もあります。例えば、データ型変換や文字列の正規化は分割する前でも問題ないです。一方、連続変数の正規化・標準化やターゲットエンコーディングといった前処理は、訓練データから統計量やパラメータを学習し、それを検証・テストデータに適用します。これによりデータリーケージを防ぎ、本番環境での…
4ヶ月前
記事のアイキャッチ画像
【Python】pygwalkerの使い方|ノーコードデータ可視化
レバレジーズ データAIブログ
はじめに こんにちは! レバレジーズデータ戦略室、データアナリティクスグループの内田です。 普段の業務では、TableauやPython(matplotlib/seaborn)を中心に使用していますが、最近は可視化ライブラリーの「pygwalker」をよく使用しています。 今回は、実際に使ってみた率直な感想と使い方についてお話しします。 pygwalkerとは pygwalkerは、プログラミング不要でドラッグ&ドロップによる直感的な操作でデータを可視化できるPythonライブラリです。Jupyter Notebook上で動作し、pandasのDataFrameを引数として渡すだけで、簡単に可…
4ヶ月前
記事のアイキャッチ画像
データ定義決定に向けた合意形成とシステム連携の壁
レバレジーズ データAIブログ
はじめに こんにちは。 レバレジーズデータ戦略室、データアーキテクトの浅見です。 データ分析基盤の構築に携わる中で、私たちは日々様々な課題に直面します。 その中でも「データ定義」に関する問題は、多くのデータアーキテクトやデータエンジニアにとって頭を悩ませるポイントではないでしょうか。 私も過去に携わったデータ分析基盤の構築において、そのデータ定義の壁に何度かぶつかりました。 本記事では、私が実際に経験したデータ定義の決定プロセスに焦点を当て、その具体的な課題と、それらをどのように乗り越えていったのか、実践的なアプローチを交えながらお話ししたいと思います。 データ定義に悩む方や、社内のデータガバ…
4ヶ月前
記事のアイキャッチ画像
Tableauレビューフローを構築してみた
レバレジーズ データAIブログ
はじめに こんにちは。 レバレジーズデータ戦略室、データアーキテクトグループの鵜飼です。 今回は、社内でTableauダッシュボードのレビューフローを整備したお話をできればと思います。 整備したばかりでまだ実運用には乗っていないのですが、着手するに至った背景や実際に行ったことをご紹介します! 取り組みが始まった背景 レバレジーズでは、これまでコードレビューは徹底されていたものの、Tableauダッシュボードの運用においては、属人化という課題を抱えていました。 その結果、ダッシュボードの作成者が退職してしまうと、残されたメンバーがその保守運用に苦心することが少なくありませんでした。 具体的には、…
5ヶ月前
記事のアイキャッチ画像
AWS Summit 生成AIハッカソンで準優勝しました!
レバレジーズ データAIブログ
はじめに こんにちは、データ戦略室兼AI推進室のブライソンです。2025年6月25、26日に、AWS Summitがありましたね。その中で、生成AIハッカソンが開催されていたので、レバレジーズのAI推進室のメンバーでチームを作り、参加しました。全部で150チームほど参加した中、準優勝することができました!応募から発表まで約1ヶ月、実装期間は約2週間の中で、プロジェクトの引き継ぎに関するプロダクトを作り上げました。今回は、このハッカソンの参加レポートを当日使った資料を入れながら書きたいと思います。 ハッカソンの概要 今回参加した生成AIハッカソンのテーマは、「使いたおして「〇〇」を実現する AI…
5ヶ月前
記事のアイキャッチ画像
Dataform~Tableau更新ワークフローをCloud Composerで実装してみた
レバレジーズ データAIブログ
はじめに こんにちは。レバレジーズデータ戦略室 データアーキテクトグループの辰野です。 前回、「初めてのCloud Composerのコード作成で躓いたこと」という記事を投稿し、そこでは「Cloud ComposerでDataformのワークフローを実行するコード」を紹介しました。その中で、これからやることとして記載していた「Tableauのデータ抽出更新を行う処理を組み込む」点について実装が完了したので、今回ご紹介できればと思います! データウェアハウス層のデータ更新~BIツールのデータソース更新方法を迷われている方にとって、少しでも参考になれば幸いです! 今回実装した内容 今回の実装では、…
5ヶ月前
記事のアイキャッチ画像
色々なAIエージェントのSDKを触ってみた
レバレジーズ データAIブログ
はじめに こんにちは、データ戦略室データアナリストのブライソンです。2025年は、AIエージェントの年と言われるくらい、AIエージェントに注目が集まっています。AIエージェントとは、簡単に言うと、特定の目的やタスクを自律的に遂行するAIを搭載したプログラムです。このAIエージェントを簡単に構築することができるPythonのライブラリが続々と出ていますので、試しに使ってみました。今回触ってみるのは、Google、OpenAI、AWSの3社が出しているライブラリです。それぞれの名前は以下になります。 Google:Agent Development Kit(ADK) OpenAI:Agents S…
5ヶ月前
記事のアイキャッチ画像
2025年度にやりたい3つのこと ~組織編~
レバレジーズ データAIブログ
はじめに こんにちは! データ戦略室でマネージャーをしている小山です。 個人的には2025年度初の記事となります。 2025年度にレバレジーズのデータ・AI部門としてやりたい3つのことという、いかにも年度はじめっぽい記事を書こうかと思います。 今回は「組織編」ということで組織運営や、組織文化に関する話題を書きます。 チーム内に対してはキックオフや普段の場などで共有している思想にはなりますが、せっかくなのでブログでも発信してみようということで書いています。 今年度やりたいことを3点記載するのですが、それぞれの詳細を記載するとかなり長くなってしまうので、この記事では概要のみにします。 組織はフェー…
5ヶ月前
記事のアイキャッチ画像
15の事例から学ぶマーケティングサイエンスの魅力
レバレジーズ データAIブログ
データ戦略室で室長かつデータサイエンティストをしている阪上です。 「マーケティングサイエンス」という言葉を聞いて、その実態や面白さについてイメージがわく方はどのくらいおられるでしょうか。今回の記事では、多くの方にマーケティングサイエンスの業務について知っていただき、この業界に関心を持っていただくことを狙いとしています。 私はレバレジーズのマーケティング部門でデータサイエンティストとして働いており、マーケティングサイエンスの面白さを日々感じています。本記事では、マーケティングサイエンスの魅力や実際の活用事例を紹介しながら、この分野の魅力をお伝えします。 マーケティングサイエンスとは? 誤解を恐れ…
6ヶ月前
記事のアイキャッチ画像
社内システムの大規模改修を3度経験して学んだこと
レバレジーズ データAIブログ
はじめに こんにちは!データ戦略室の田代です。 近年の目覚ましい技術進化と当社の事業拡大に伴い、社内システムのフルリプレイスや大規模改修といった重要なプロジェクトに、データ戦略の観点から関わる機会が増えてきました。 そこで今回は、私がこれまでに当社で3度経験したシステム大規模改修プロジェクトにおいて、データ担当者としてどのように貢献し、そこから何を得たのか、具体的な事例を交えながらご紹介します。 この記事が、データ活用に取り組む方はもちろん、システム開発に携わるエンジニアの皆様にとっても、日々の業務のヒントとなれば幸いです。 プロジェクト概要: どのようなシステム改修に携わってきたのか、簡単に…
6ヶ月前
記事のアイキャッチ画像
これを見れば迷わない!GoogleCloudでのデータ分析基盤構築における用途別ガイド
レバレジーズ データAIブログ
こんにちは、データ戦略室アナリティクスグループ リーダーの丸山です! 最近GoogleCloudのデータエンジニアリングに関するサービスの違いを改めて整理したいと思い、「改訂新版 Google Cloudではじめる実践データエンジニアリング入門」という本を読みました。GoogleCloudで分析基盤を構築する上で、必要なサービスの説明を1つ1つ丁寧にしている良書でした。 そこで今回は、書籍の内容を自分なりに整理しながら、アナリストの目線で便利だと思ったサービスを紹介します。具体的には、GoogleCloudの主要なデータエンジニアリングサービスであるDataform、Dataflow、Clou…
6ヶ月前