レバレジーズ データAIブログ
https://analytics.leverages.jp/
インハウスデータ組織のあたまのなか
フィード

モデル内部構造の可視化ツールNeuronpediaを触ってみた
レバレジーズ データAIブログ
はじめに こんにちは、レバレジーズで研究員をしている永安といいます。レバレジーズの研究員は最新の技術をキャッチアップしつつ事業に活かしていくことを目標に活動しています。 私は特にAIの安全性、説明手法をテーマに研究活動を行っています。 さて、みなさんMLモデルを学習した時に、そのモデルの動作を理解するためにSHAPなどを使うことがあると思います。近年、SHAPのような入力特徴量の寄与を超えて、モデルの内部構造を理解しようとするMechanistic Interpreterbilityという分野が発展してきました。今回はMechanistic Interpreterbilityに基づいた可視化ツ…
3日前

LLMの回答精度を評価する仕組みを作ってみた
レバレジーズ データAIブログ
はじめに こんにちは、レバレジーズテクノロジー戦略室でAIエンジニアをしている安藤です。 今回は最近社内で急速に導入が進んでいるLLMの精度評価の仕組みの構築について記載します。 現状、この分野は知見も少ないので我々も手探り状態ではありますが何か参考になれば嬉しいです。 背景 & 課題 LLM回答精度評価の難しさ 最近のLLMの普及に伴い、レバレジーズでも続々と業務改善やプロダクトにLLMが利用されるようになってきました。LLM導入はもっぱらサードパーティが提供するAPIを利用することで完了するものが多く、技術的に簡単に導入できるため導入数は急激に増えていきました。 一方でLLMの厄介さは導入…
9日前

BigQuery MLを用いたフリーテキストのカテゴリ分類
レバレジーズ データAIブログ
はじめに こんにちは! データエンジニアの森下です。今回はBigQuery MLからGeminiを使用したフリーテキストの分類についてお話しようと思います。BigQuery ML を業務で使うのは初めてでしたが、思ったより簡単に SQL から LLM を呼び出すことができ、業務への応用がしやすくなったと感じています。 BigQueryMLの概要 BigQuery MLは、Google CloudのBigQuery上で、SQLを使って機械学習モデルを直接作成・実行できる機能です。 通常、機械学習モデルの構築にはPythonを使って実装することが多いですが、BigQuery MLはデータアナリスト…
17日前

システムをシンプルにするための攻めのリアルタイム推論導入 ―― SageMaker Endpointのscale to zero機能
レバレジーズ データAIブログ
はじめに レバレジーズで機械学習エンジニアをしている稲垣です。 現在、とあるシステムにレコメンド機能を導入するプロジェクトを担当しています。 その中で、システムにSageMakerの新しめの機能をうまく活用できたので、その紹介をしたいと思います。 ぶつかった課題感 今回担当したレコメンドの主な要件は以下でした。 レコメンドの更新頻度は日次でOK レコメンドを必要とするシステムAから、レコメンドサーバ(今回の開発対象)に日次でリクエストが来るので、そのリクエストに応じてレコメンドデータを返す レコメンドサーバの実装方法の大きな分類としては「バッチ推論」と「リアルタイム推論」の 2 つがありますが…
23日前

DuckDB MCPを利用した、ローカル環境でのお手軽データ分析のすゝめ
レバレジーズ データAIブログ
はじめに はじめまして、テクノロジー戦略室室長の竹下です。現在、AI推進室として活動しており、今回こちらのブログにお邪魔して書かせてもらいました。Leverages Tech Blogでもいろいろ書いているので、そちらもぜひ見てください! 業務上、アンケートの分析だったり、そこからの示唆の分析などを行うことも多々あるのですが、そんな時に最近はDuckDBを利用しています。この記事では、DuckDB + DuckDB MCP + VSCode copilotを利用した自然言語で分析を手軽にできる環境のご紹介をしたいと思います。 DuckDBとは DuckDBとは、ローカル、シングルノードで動作す…
1ヶ月前

1000件アノテーション&3ヶ月プロンプト泥試合で実現した、工数40%削減の候補者検索ツール
レバレジーズ データAIブログ
トンでも君 データ戦略室で室長兼データサイエンティストをしている阪上です。本日は会社にある非構造化データを宝の山に変えたボトムアップでの取り組みについて紹介したいと思います。最後にはプロンプトのサンプルも付録としてつけておりますので、参考にしていただけると幸いです。 なお、冒頭の画像は、今回作成したツールのイメージキャラクターで「トンでも君」です。私は社内で開発したツールにイメージキャラクターやユニークな名前を付けることをしばしば行います。今回は、宝物を見つける→トリュフは宝である→豚はトリュフを見つける→豚のキャラクターにするという思考回路です。 背景と制約 一昔前まで、お客様の仕事経験に関…
1ヶ月前

データアナリストがソフトウェアテストを使ってデータ品質のテストをしてみた
レバレジーズ データAIブログ
こんにちは。データアナリストの田代です。 データを分析していて、「SQLのロジックは合っているはずなのに、集計結果にどうも違和感がある…」そんな経験はありませんか? 最近、まさにそのような課題に直面しました。システムから連携されるデータを使った分析で、原因のわからない数値のズレが見つかったのです。調査を進める中で、「データそのものの品質」に体系的に向き合う必要がある、という結論に至りました。 今回は、システムの内部が見えない「ブラックボックス」を相手に、どのようにデータ品質を検証していったのか、その際に役立った「ソフトウェアテスト」の考え方と具体的なアプローチについてお話しします。 はじめに:…
1ヶ月前

事業予算策定のためのKPI予測モデルの運用
レバレジーズ データAIブログ
はじめに レバレジーズ、データ戦略室データアナリティクスグループの丸山です。 皆さんの事業部では、予算策定の時期にこのような課題に直面していませんか? 「来期の売上はこれくらい」という目標が、勘や経験則で設定されている トップダウンで決まった目標数字だけがあり、達成までの具体的な道筋が見えない 施策と予算がうまく連動しておらず、効果的なリソース配分ができていない 本記事では、こうした課題を解決するために構築した、KPIの連動性を考慮したKGI予測モデルと、それを用いたデータドリブンな予算策定のフレームワークについて説明します。 なお、企業における予算の区分はこちらのサイトで説明されている通り、…
2ヶ月前

Claude Desktop + Obsidian + Kindle = 最強の読書要約環境が完成した話
レバレジーズ データAIブログ
はじめに こんにちは、データアナリティクスグループの丸山です。 私は業務で必要な知識を得るために定期的に書籍を読むようにしているのですが、読書をする上で以下のようなあるあるを皆さんも体験したことがあると思います。 本は読んだけど、内容を思い出せない かといってメモを取るのは面倒だ 書籍で得られた知識同士がつながらず、断片的なままになってしまう そんな悩みを、Claude DesktopとObsidianの組み合わせで解決することを試みました。今回は、この革新的な読書要約システムを紹介します。なお、今回のシステムはKindleでの読書を行うことを前提にしています。 Obsidianとは Obsi…
2ヶ月前

AIコーディングツール比較:Kiro vs Claude Code レビュー
レバレジーズ データAIブログ
はじめに こんにちは。データ戦略室、アナリティクスグループの高津です。AIコーディングツールが次々と登場し、便利だと感じる一方で、正直どれがいいのだろうかと選択に悩まれている方も多いのではないでしょうか。 そこで今回は、AIコーディングツールとしては新しいAWSの「Kiro」と、Anthropicの「Claude Code」について、実際に同一タスクを実行して比較検証を行いました。 それぞれのツール紹介 Kiro KiroはAWSが2025年7月にリリースしたエージェント型統合開発環境です。従来のコーディングツールとは異なり、要件定義、詳細設計、タスクリストを段階的に作成した後に実装に着手する…
2ヶ月前

半導体メーカーの生産管理職から転職して3ヶ月、データ戦略室で感じたこととこれから
レバレジーズ データAIブログ
はじめに こんにちは。データ戦略室、データアーキテクトグループの櫻井です。今回は、半導体メーカーの生産管理職からレバレジーズ、データ戦略室のデータアーキテクトとして中途入社し、3ヶ月が経過する中で感じたことについてお話ししたいと思います。私のバックグラウンドを振り返りつつ、データ戦略室での業務内容、そして今後挑戦したいことについても触れます。データ戦略室でもあまり前例のない経歴ですので、その点も楽しんでいただけたら嬉しいです。 前職での仕事内容 私は2022年3月に大学院を修了し、同年4月に半導体メーカーへ新卒で入社。生産管理部門に配属されました。業務を覚え、実践する中で充実感を得ていましたが…
2ヶ月前

前処理ライブラリ、NVTabularを触ってみた
レバレジーズ データAIブログ
はじめに こんにちは!レバレジーズデータ戦略室、データサイエンティストのJacobです。 今回は、大規模データ処理に特化したPythonライブラリ「NVTabular」について書きたいと思います。 どの機械学習モデルにも前処理が必要です。データセットを訓練・検証・テストセットに分割する前の前処理もあれば、分割後の前処理もあります。例えば、データ型変換や文字列の正規化は分割する前でも問題ないです。一方、連続変数の正規化・標準化やターゲットエンコーディングといった前処理は、訓練データから統計量やパラメータを学習し、それを検証・テストデータに適用します。これによりデータリーケージを防ぎ、本番環境での…
2ヶ月前

【Python】pygwalkerの使い方|ノーコードデータ可視化
レバレジーズ データAIブログ
はじめに こんにちは! レバレジーズデータ戦略室、データアナリティクスグループの内田です。 普段の業務では、TableauやPython(matplotlib/seaborn)を中心に使用していますが、最近は可視化ライブラリーの「pygwalker」をよく使用しています。 今回は、実際に使ってみた率直な感想と使い方についてお話しします。 pygwalkerとは pygwalkerは、プログラミング不要でドラッグ&ドロップによる直感的な操作でデータを可視化できるPythonライブラリです。Jupyter Notebook上で動作し、pandasのDataFrameを引数として渡すだけで、簡単に可…
3ヶ月前

データ定義決定に向けた合意形成とシステム連携の壁
レバレジーズ データAIブログ
はじめに こんにちは。 レバレジーズデータ戦略室、データアーキテクトの浅見です。 データ分析基盤の構築に携わる中で、私たちは日々様々な課題に直面します。 その中でも「データ定義」に関する問題は、多くのデータアーキテクトやデータエンジニアにとって頭を悩ませるポイントではないでしょうか。 私も過去に携わったデータ分析基盤の構築において、そのデータ定義の壁に何度かぶつかりました。 本記事では、私が実際に経験したデータ定義の決定プロセスに焦点を当て、その具体的な課題と、それらをどのように乗り越えていったのか、実践的なアプローチを交えながらお話ししたいと思います。 データ定義に悩む方や、社内のデータガバ…
3ヶ月前

Tableauレビューフローを構築してみた
レバレジーズ データAIブログ
はじめに こんにちは。 レバレジーズデータ戦略室、データアーキテクトグループの鵜飼です。 今回は、社内でTableauダッシュボードのレビューフローを整備したお話をできればと思います。 整備したばかりでまだ実運用には乗っていないのですが、着手するに至った背景や実際に行ったことをご紹介します! 取り組みが始まった背景 レバレジーズでは、これまでコードレビューは徹底されていたものの、Tableauダッシュボードの運用においては、属人化という課題を抱えていました。 その結果、ダッシュボードの作成者が退職してしまうと、残されたメンバーがその保守運用に苦心することが少なくありませんでした。 具体的には、…
3ヶ月前

AWS Summit 生成AIハッカソンで準優勝しました!
レバレジーズ データAIブログ
はじめに こんにちは、データ戦略室兼AI推進室のブライソンです。2025年6月25、26日に、AWS Summitがありましたね。その中で、生成AIハッカソンが開催されていたので、レバレジーズのAI推進室のメンバーでチームを作り、参加しました。全部で150チームほど参加した中、準優勝することができました!応募から発表まで約1ヶ月、実装期間は約2週間の中で、プロジェクトの引き継ぎに関するプロダクトを作り上げました。今回は、このハッカソンの参加レポートを当日使った資料を入れながら書きたいと思います。 ハッカソンの概要 今回参加した生成AIハッカソンのテーマは、「使いたおして「〇〇」を実現する AI…
3ヶ月前

Dataform~Tableau更新ワークフローをCloud Composerで実装してみた
レバレジーズ データAIブログ
はじめに こんにちは。レバレジーズデータ戦略室 データアーキテクトグループの辰野です。 前回、「初めてのCloud Composerのコード作成で躓いたこと」という記事を投稿し、そこでは「Cloud ComposerでDataformのワークフローを実行するコード」を紹介しました。その中で、これからやることとして記載していた「Tableauのデータ抽出更新を行う処理を組み込む」点について実装が完了したので、今回ご紹介できればと思います! データウェアハウス層のデータ更新~BIツールのデータソース更新方法を迷われている方にとって、少しでも参考になれば幸いです! 今回実装した内容 今回の実装では、…
3ヶ月前

色々なAIエージェントのSDKを触ってみた
レバレジーズ データAIブログ
はじめに こんにちは、データ戦略室データアナリストのブライソンです。2025年は、AIエージェントの年と言われるくらい、AIエージェントに注目が集まっています。AIエージェントとは、簡単に言うと、特定の目的やタスクを自律的に遂行するAIを搭載したプログラムです。このAIエージェントを簡単に構築することができるPythonのライブラリが続々と出ていますので、試しに使ってみました。今回触ってみるのは、Google、OpenAI、AWSの3社が出しているライブラリです。それぞれの名前は以下になります。 Google:Agent Development Kit(ADK) OpenAI:Agents S…
4ヶ月前

2025年度にやりたい3つのこと ~組織編~
レバレジーズ データAIブログ
はじめに こんにちは! データ戦略室でマネージャーをしている小山です。 個人的には2025年度初の記事となります。 2025年度にレバレジーズのデータ・AI部門としてやりたい3つのことという、いかにも年度はじめっぽい記事を書こうかと思います。 今回は「組織編」ということで組織運営や、組織文化に関する話題を書きます。 チーム内に対してはキックオフや普段の場などで共有している思想にはなりますが、せっかくなのでブログでも発信してみようということで書いています。 今年度やりたいことを3点記載するのですが、それぞれの詳細を記載するとかなり長くなってしまうので、この記事では概要のみにします。 組織はフェー…
4ヶ月前

15の事例から学ぶマーケティングサイエンスの魅力
レバレジーズ データAIブログ
データ戦略室で室長かつデータサイエンティストをしている阪上です。 「マーケティングサイエンス」という言葉を聞いて、その実態や面白さについてイメージがわく方はどのくらいおられるでしょうか。今回の記事では、多くの方にマーケティングサイエンスの業務について知っていただき、この業界に関心を持っていただくことを狙いとしています。 私はレバレジーズのマーケティング部門でデータサイエンティストとして働いており、マーケティングサイエンスの面白さを日々感じています。本記事では、マーケティングサイエンスの魅力や実際の活用事例を紹介しながら、この分野の魅力をお伝えします。 マーケティングサイエンスとは? 誤解を恐れ…
4ヶ月前

社内システムの大規模改修を3度経験して学んだこと
レバレジーズ データAIブログ
はじめに こんにちは!データ戦略室の田代です。 近年の目覚ましい技術進化と当社の事業拡大に伴い、社内システムのフルリプレイスや大規模改修といった重要なプロジェクトに、データ戦略の観点から関わる機会が増えてきました。 そこで今回は、私がこれまでに当社で3度経験したシステム大規模改修プロジェクトにおいて、データ担当者としてどのように貢献し、そこから何を得たのか、具体的な事例を交えながらご紹介します。 この記事が、データ活用に取り組む方はもちろん、システム開発に携わるエンジニアの皆様にとっても、日々の業務のヒントとなれば幸いです。 プロジェクト概要: どのようなシステム改修に携わってきたのか、簡単に…
4ヶ月前

これを見れば迷わない!GoogleCloudでのデータ分析基盤構築における用途別ガイド
レバレジーズ データAIブログ
こんにちは、データ戦略室アナリティクスグループ リーダーの丸山です! 最近GoogleCloudのデータエンジニアリングに関するサービスの違いを改めて整理したいと思い、「改訂新版 Google Cloudではじめる実践データエンジニアリング入門」という本を読みました。GoogleCloudで分析基盤を構築する上で、必要なサービスの説明を1つ1つ丁寧にしている良書でした。 そこで今回は、書籍の内容を自分なりに整理しながら、アナリストの目線で便利だと思ったサービスを紹介します。具体的には、GoogleCloudの主要なデータエンジニアリングサービスであるDataform、Dataflow、Clou…
4ヶ月前

レバレジーズ内定者インターンで感じたデータ戦略室の魅力
レバレジーズ データAIブログ
はじめに こんにちは。2025年4月に新卒でレバレジーズに入社いたしました、大西と申します。この記事では、私が2024年11月中旬から2025年2月末まで、内定者インターンとして所属したデータ戦略室データアーキテクトグループの実体験をもとに、実際の業務内容や”インターン生から見たデータ戦略室の魅力”についてご紹介します。 バックグラウンド データ戦略室に入るまで、私のデータベースやデータ分析に関する知識は、大学の講義や簡単な演習程度でした。大学在学中にFintech企業のインターンでBigQueryに触れる機会はありましたが、既存のクエリを一部修正する程度(where句で日付範囲を絞る条件を変…
5ヶ月前

面談データが語るサービス改善の新潮流:LLMとクラスター分析で見えてきた転職支援の傾向
レバレジーズ データAIブログ
はじめに こんにちは!レバレジーズデータ戦略室、データサイエンティストのJacobです。 今回は、弊社の転職支援サービスの改善のための面談分析について書きたいと思います。数多くの求職者のサポートに励んでいる弊社のキャリアアドバイザー(CA)のハイパフォーマーにはどのような特徴があるのかという分析です。様々な仮説がある中で、求職者との面談のデータを分析するとどのような傾向が見られるでしょうか。 分析方法 対象データは700件の面談の文字起こしです。面談の中には、弊社の紹介から具体的な企業提案まで、様々な転職に関する話題が出ます。非構造化データであるため、LLMを通じて分析することが効果的です。今…
5ヶ月前

データエンジニアが挑む!レコメンドシステム開発の裏側
レバレジーズ データAIブログ
はじめに こんにちは!レバレジーズのテクノロジー戦略室でデータエンジニアをしている鈴木です。当社では40以上の事業を展開しており、データエンジニアリングだけでなく、様々な分野に挑戦できる環境があります。 今回はその一例として、私が関わったレコメンドシステムの刷新について、特にインフラ面の工夫を中心にご紹介します。「データエンジニアリング以外にも、色々挑戦できそうだな」という雰囲気だけでも伝わると幸いです! どんなシステムを作ったの? 私たちが開発したのは、スカウトサービスにおける、企業向けの求職者レコメンド機能です。開発メンバーは3名で、私は主にインフラを担当しました。 システムの仕組み (ア…
5ヶ月前

勉強会より効果的? 「書籍紹介」で実現する自律的インプット文化
レバレジーズ データAIブログ
こんにちは、データ戦略室アナリティクスグループ リーダーの丸山です! データ戦略室ではメンバーのスキルアップと知識の共有を目的として、これまで様々なインプット施策に取り組んできました。 その中でも、今回は「書籍紹介」という取り組みについて、目的や具体的な内容を共有します。また、この取り組みでメンバーがおすすめした書籍も併せてご紹介したいと思います! 取り組みの目的・流れ データ分析やデータエンジニアリングの世界は日進月歩です。 常に新しい技術や考え方が登場し、キャッチアップし続けることが求められます。 そのため、組織としてインプットを促進する取り組みを行うことは非常に重要です。 このような取り…
5ヶ月前

Pythonで社員間の性格類似度を算出してみた
レバレジーズ データAIブログ
はじめに こんにちは! レバレジーズデータ戦略室、データアナリストの内田です。 今回は、性格診断の結果を活用して、社員間の「性格類似度」を数値化する分析手法の一例をご紹介します。 人の性格や相性といった、これまで感覚的に捉えられることが多かった要素について、データを用いて定量的に評価する試みについて、その手法と考え方を解説していきます。 分析の目的 今回の分析が目指すことの一つは、「組織全体の活性化」に貢献することです。 そのアプローチの一環として、社員同士の性格的な類似性をデータに基づいて定量的に把握しました。この類似性に関する情報が、組織活性化に向けた取り組みの参考として、社内で活用される…
5ヶ月前

Tableau Cloudのデータソース更新失敗を防ぐための実践的対策
レバレジーズ データAIブログ
はじめに こんにちは。 レバレジーズデータ戦略室、データアーキテクトの浅見です。 今回は、Tableau Cloudでの「データソース更新」に潜む落とし穴についてお話しします。 尚、本記事では「サーバー」から利用できるデータソース(レバレジーズでは「Google BigQuery」を接続)の更新をするケースに絞って言及していきます。 Tableauを使ってデータを可視化している方にとって、「データソースの更新」は避けて通れない重要なプロセスです。しかし、データソースの設計や更新方法次第では、更新が失敗しやすくなるリスクがあることをご存じでしょうか? 実際、レバレジーズのTableau環境でも、…
6ヶ月前

部署専任のデータ分析組織が発揮できる価値
レバレジーズ データAIブログ
はじめに はじめまして。ヒューマンキャピタル事業本部事業企画部の武田です。 私はデータ戦略室に所属しているわけではなく、若年層特化型人材紹介サービスのハタラクティブを運営している事業部に所属しています。そのなかの事業企画部という部署のデータアナリティクスチームというところで働いています。 これまでの経歴を説明すると、3年前に営業職で入社をして営業とチームのマネジメントをしてきました。そして、去年の5月に部署内でデータ分析の専門チームを立ち上げるということで、その一人目としてアサインされたという経緯になります。 ここまで読んだところで「わざわざ事業部内に作る必要はないのでは?データ戦略室に任せれ…
6ヶ月前

データの民主化を考える 〜正しく活用される基盤づくりとは〜
レバレジーズ データAIブログ
はじめに こんにちは。 レバレジーズデータ戦略室、データアーキテクトグループの鵜飼です。 今回は、よく耳にする「データの民主化」という概念について、実現するためには一体どうしたらいいのか、自分がデータ分析基盤の活用促進を進めていく過程や、他社様の事例をから得た気付きを交えながらを書いていければと思っています。 レバレジーズでデータの民主化を完璧に実現できているわけではなく、思ったことや今後の展望を記載しておりますので、一意見としてご覧いただき、みなさんが考えるデータの民主化の理想形を教えていただけると非常に嬉しく思います! データの民主化とは 「データの民主化」という言葉の定義は様々ですが、ま…
6ヶ月前