ABEJA Tech Blogのフィード｜企業テックブログRSS

ABEJA Tech Blog

https://tech-blog.abeja.asia/

中の人の興味のある情報を発信していきます

フィード

ABEJA Tech Blog

はじめに Apache Airflowって何？基本の考え方 DAG（Directed Acyclic Graph）タスク Operator Airflowの中身（ざっくり構成）実際に動かしてみる 1. 公式 compose の取得 2. 共有ディレクトリを用意（DAG/ログ/プラグイン/設定） 3. 権限用の .env を置く 4. 初期化（DB マイグレーション & 初回ユーザー作成） 5. 起動 6. 動作確認まとめ We are hiring! はじめにこんにちは！プラットフォーム共通基盤グループでエンジニアをしている和田です。最近、開発をしている中で、何が、いつ、どの順番でタ…

3日前

【リファクタリング】フロントエンドのロジックを凝集して、UIコンポーネントから切り離してみた

ABEJA Tech Blog

はじめに方針具体例作るものドメインロジック（クラススタイル） reducer（クラススタイル）コンポーネント上での値の更新（クラススタイル）ドメインロジック（関数スタイル） reducer（関数スタイル）コンポーネント上での値の更新（関数スタイル）思考実験を通して感じたことクラススタイルと関数スタイルの違いドメインロジックの凝集 UIロジックの凝集コンポーネントの役割最後に参考：コード全文はじめにプラットフォームアプリケーショングループで開発を担当している平原です。 Next.jsのフロントエンドの開発を行っているときに、複雑化してきたことでバグが出やすくなって…

1ヶ月前

様々なコンテキスト長における LLM の Self-Attention の Query と Key の分析

ABEJA Tech Blog

ABEJAでデータサイエンティストをしている藤原です。今回は LLM のロングコンテキスト言語処理（Long-context language modeling; LCLM）に関連するブログになります。近年の LLM ではオープン・クローズド問わずより長大なコンテキストを正確に扱えるモデルが増えてきています。このようにロングコンテキストLLMが増えてくると、どのようにモデルのLCLM性能を評価すべきかが課題となります。しかしながら、日本語の LCLM 評価のデータセットやベンチマークは現状なく、自作するにしても 128k トークンもある文章を人間が読んで品質を担保するのはかなり難しい問題だ…

2ヶ月前

位置インデックス情報を操作して LLM に長文と錯覚させたらどうなるか？

ABEJA Tech Blog

ABEJAでデータサイエンティストをしている藤原です。今回も LLM のロングコンテキスト言語処理（Long-context language modeling; LCLM）に関連するブログになります。前回のブログはこちらです。様々なコンテキスト長における LLM の Self-Attention の Query と Key の分析 - ABEJA Tech Blog 近年の LLM ではオープン・クローズド問わずより長大なコンテキストを正確に扱えるモデルが増えてきています。このようにロングコンテキストLLMが増えてくると、次はどのようにしてモデルのLCLM性能をどう評価すべきかが課題にな…

2ヶ月前

心理的安全性ってどう測る？どう高める？システム開発部での取り組み

ABEJA Tech Blog

こんにちは！システム開発部でエンジニアをやっている春名です。最近のテックブログはロボット関連が多いですが、この記事では私がABEJAに入社した2023年から取り組んでいる「心理的安全性」に関する取り組みの内容をご紹介します。心理的安全性といえば、Googleが提唱したチームパフォーマンス向上の要素として有名で、「チームの中で誰もが安心して発言できる状態」を指します（参考：Googleの心理的安全性ワークブック）。この記事では、そうした一般的な概念を踏まえたうえで、どのように心理的安全性を捉え高めようとしているかをまとめています。システム開発部として目指している目標は「誰もが積極的に発…

3ヶ月前

Uber が社内で運用している会計部門向けのAIエージェント『Finch』

ABEJA Tech Blog

こんにちは、ABEJA Platform に搭載しているアプリケーション、「ABEJA Insight for Retail」の開発と運用を担当している森永です。導入いただいた企業様がよりデータドリブンな組織へと変革できるように日々新しい機能をリリースしていて、現在ベータ版として提供しています「AIスーパーバイザー」もその機能の 1 つです。「ABEJA Insight for Retail」に蓄積いただいたデータからAIエージェントが適切な示唆出しやレポート作りが行える機能となっていて、特にデータ分析を苦手とするユーザーを支援する目的で作っています。 AI スーパーバイザーの画面今後の…

3ヶ月前

サクッとKeycloakに入門してみた（OIDCによるログイン・JWT検証・カスタムクレーム）

ABEJA Tech Blog

背景 Keycloakとは動かしてみるローカル環境でKeycloakを立ち上げる概念を理解する OIDCでログインするための準備カスタムクレームを設定 Group Attributeを利用する方法 User Attributeを利用する方法 audの設定ブラウザでOIDCでアクセストークンを取得取得したアクセストークンを検証 Pythonで検証 Goで検証本番までに気をつけたいところまとめ背景プラットフォームアプリケーショングループで開発を担当している平原です。これまで利用していた認証サービスを自前でホストする必要が生じたので、オープンソースの認証基盤を調査しました。 …

3ヶ月前

NVIDIA H200 × 8でどれくらいの規模の事前学習を実施できるか

ABEJA Tech Blog

ABEJAでデータサイエンティストをしている岩城です。 NVIDIA H200 GPUはハイパフォーマンスコンピューティング (HPC) ワークロード向けに設計されたもので、LLMの推論を高速に行うことができます。現在では様々なクラウドコンピューティングサービスがH200を提供しています。今回は、NVIDIA H200を搭載したGPUサーバでどれくらいの規模のLLMの事前学習を行うことができるのか検証しました。概要環境実験結果学習可能性実行時間 GPUメモリ使用状況最後に謝辞 We are hiring! 概要 NVIDIA H200 × 8が1ノードというGPU環境でどれ…

3ヶ月前

ユーザーに寄り添うQAエンジニアリング　　～ユーザー視点を活かす強み

ABEJA Tech Blog

こんにちは！ABEJAの中村です。今回は、私がABEJAでQAエンジニアとして6年間にわたり取り組んできた経験、特にユーザー視点を活かしたQAエンジニアリングについてお話したいと思います。ユーザー視点重視のQAエンジニアとは QAエンジニアの構成要素説明顧客理解ユーザーの行動やニーズを深く理解し、体験を向上させるための洞察力を養うコミュニケーション能力ユーザーの意見や課題をステークホルダーにわかりやすく伝える広い視点ユーザビリティを考慮し、製品の改善に活かす視点を持つプロダクトライフサイクルアイデアの段階からリリース後まで、プロダクト全体を横断する視点を持つチームとの協…

3ヶ月前

デジタル庁ガイドブックを使ってサービスのさらなるバリューアップに挑戦！

ABEJA Tech Blog

ABEJAでデザイナーをしている小林です！現在、「ABEJA Insight for Retail」という小売業界向けのDXツールに関するダッシュボードのバリューアップを進めております。来店から購入までの行動を分析するこのツールには、いくつかの課題があり、より使いやすくなるようアップデートを目指しています。課題を一部挙げると技術的な混乱を招いていたライブラリの混在（ReactとVueの併用）により、既存ページの改修が難しい。画面全体でUIコンポーネントがバラバラに使用されており、統一感の欠如が見られる。ダッシュボード設計において、UXコンセプトが明確でないことでユーザー体験が不十分…

3ヶ月前

ローカル LLM で動く Deep Research を参考に LangGraph に入門してみる

ABEJA Tech Blog

タイトルこんにちは、ABEJA Platform に搭載しているアプリケーション、「ABEJA Insight for Retail」の開発と運用を担当している森永です。今回は LangChain 社より公開されている local-deep-researcher という、ローカル LLM で動作する Deep Research を簡単に作成できる OSS を動かして、その構造について解説します。 ※ 本記事では Linux と Mac 向けの動作手順を記載しています。 Windows 向けの環境構築手順は下記レポジトリの README をご参照ください。 github.com こちらの O…

3ヶ月前

SO-101のモーター制御を深掘りして調整する〜SO-101は指示通りの位置へ移動しているのか？〜

ABEJA Tech Blog

TL;DR SO-101はAI（VLAなどの基盤モデルやACTなどの模倣学習）の指示からモーター内部の制御によって指定した位置に移動している。指示通りの位置へ移動できることは外乱、構造、制御の特性の影響があるので当たり前ではない。 SO-101はAIが指示した位置にアームが完全に移動しきれていないことがある。現在のモーター制御は実質的なPD制御（I=0）であり、アームを伸ばした時など重力下で定常偏差が発生する。解決策として、特に重力の影響が大きいモーターにIゲイン（積分要素）を導入し、モーターごとの負荷に合わせたPID制御の最適化を検討した。 LeRobotのコードはSTS3215の使い…

3ヶ月前

NeMo 2.0の実行環境を構築してLLMの事前学習を始める方法

ABEJA Tech Blog

ABEJAでデータサイエンティストをしている岩城です。今回は株式会社ハイレゾ様のGPUクラウドサービス「GPUSOROBAN」を利用させていただき、NeMo 2.0を用いて大規模言語モデルの事前学習を行いました。本検証では、あえてNVIDIA公式のDockerコンテナを使用せず環境構築してみたので、その詳細についてお伝えできればと思います。その理由としては、NeMo関連のライブラリは絶賛開発が進められている中で、新たな昨日や新たなLLMへの対応などが日々進められています。そうした新規機能が出たとき、柔軟に取り込んで試してみたいと考え、uvで関連ライブラリのバージョン管理をしたいなと思い…

3ヶ月前

gpt-oss-120bをpythonとvLLMで触りながら理解する

ABEJA Tech Blog

データサイエンティストをしている服部です。 OpenAIからgpt-ossというオープンモデルが登場しました。早速ですが、このモデルを使いながら中身を理解していきたいと思います。 gpt-ossのモデル特徴 vLLM上で動かす通常のtokenizerで動かす最終出力と思考部分 chat templateも見てみる Tool Useを試す Built-in toolも試す Python blowser 複数のツールを同時並列で使えるか？まとめ We Are Hiring! gpt-ossのモデル特徴 openai.com 他にも紹介している記事はたくさんあるため手短に... 今回Open…

3ヶ月前

NVIDIA OmniverseとCosmosを活用したロボティクス向け合成データ生成〜学習用データ不足問題の解決編

ABEJA Tech Blog

こんにちは！ABEJA で ABEJA Platform 開発を行っている坂井（@Yagami360）です。以下の記事では、Cosmos を実際に動かしてみながら Cosmos により物理法則が考慮されたフォトリアリスティックな動画生成（合成データ生成）が可能であることを確かめました。 tech-blog.abeja.asia しかしながら Cosmos 単体では単に動画生成を行うだけなので、これだけではロボティクスモデル（VLAなど）用の学習用データセットとしては利用できなく、実際のロボティクス開発において Cosmos を活用できません。そのため本記事では、Cosmos と NVIDI…

3ヶ月前

NVIDIA Cosmos の世界基盤モデルによる合成データ生成入門〜 Cosmos Transfer 編

ABEJA Tech Blog

本記事は、以下の記事の後編記事になります。 tech-blog.abeja.asia NVIDIA Cosmos の概要や Cosmos Predict に関しては、上記の前半記事をご確認ください。後編記事では、Cosmos Transfer を実際に動かしながらその機能を確かめていきます Cosmos Transfer による合成データ生成環境構築エッジ情報からの合成データ生成深度マップ情報からの合成データ生成セグメンテーション情報からの合成データ生成マルチモーダルでの合成データ生成 Cosmos Transfer によるデータ拡張まとめ We Are Hiring! Cosm…

3ヶ月前

NVIDIA Cosmos の世界基盤モデルによる合成データ生成入門〜 Cosmos Predict 編

ABEJA Tech Blog

こんにちは！ABEJA で ABEJA Platform 開発を行っている坂井（@Yagami360）です。今年の CES2025 にて、 NVIDIA から Cosmos という自動運転やロボティクス用のプラットフォームをリリースしたという発表が大々的にありました。 blogs.nvidia.co.jp CES 2025での NVIDIA 発表動画は、以下を見ていただければと思います（Cosmos以外にも色々発表しています） youtu.be Cosmos は、NVIDIA が提唱している「フィジカル AI」の開発を促進するプラットフォームであり「世界基盤モデル」なるものを使っているとのこ…

3ヶ月前

SmolVLA×SO-101で色付きキューブ搬送【同期推論】

ABEJA Tech Blog

はじめに SmolVLAとはタスク設定とデータセット作成タスク概要環境データセット作成 SmolVLA のファインチューニング評価と結果汎用性の評価考察とまとめ We Are Hiring! はじめにこんにちは！ABEJAでエンジニアをしている宇留嶋です。2025年5月にオープンソース化されたSO‑101ロボットアームとHugging FaceのLeRobotライブラリを活用し今回Vision‑Language‑Action(VLA)モデルSmolVLAをファインチューニングして「色付きキューブを所定エリアに運ぶ」タスクに挑戦しました。本記事では、データセット作成から学習・評…

4ヶ月前

H200 GPU x 8基で Qwen2.5-VL-72B-Instruct を使った OCR を試してみる

ABEJA Tech Blog

ABEJAでデータサイエンティストをしている藤原です。今回は、株式会社ハイレゾ様のGPUクラウドサービス「GPUSOROBAN」で H200 GPU × 8基構成のシングルノードサーバを用いて、大規模モデルを使用した検証を実施しました。本記事では、その検証でのGPUサーバの使用方法や、検証内容の一つである Qwen2.5-VL-72B-Instruct を用いたOCRの結果についてご紹介します。 highreso.jp はじめに GPUクラウドサービス「GPUSOROBAN」について GPUサーバの使い方の方針と事前準備 Qwen2.5-VL-72B-Instruct を使った OCR を試…

4ヶ月前

Raspberry Pi で作るWebカメラ映像配信（物体検出機能付き）

ABEJA Tech Blog

はじめに ABEJA 新卒エンジニアの和田です。趣味で購入した Raspberry Pi が使われずに眠っていたため、USB 接続の Web カメラでリアルタイム映像を取得し、何か面白いことをしたいと思い立ちました。本記事では、低コストかつシンプルに映像入力環境を整える方法として、Raspberry Pi と USB カメラを用いたリアルタイム物体認識ストリーミングの構築手順を解説します。必要なのは Raspberry Pi 4 Model B と USB カメラだけ。数十分で映像のキャプチャから物体検出、ブラウザ配信までを一気に実現できます。この仕組みを作ることで、まず自宅に設置したカメラ…

4ヶ月前

SO-101で試すSmolVLA非同期推論

ABEJA Tech Blog

はじめに SmolVLAとは非同期推論のメリット非同期推論スタックの仕組み全体構成 AsyncInference ServiceのRPC設計とデータフロー実験タスク定義実行コマンド Policy Server起動コマンド Robot Client起動コマンド実験結果アクションキューサイズの経時変化成功・失敗動画考察とまとめ We Are Hiring! はじめにこんにちは、ABEJAでエンジニアをしている宇留嶋です。今回は Vision‑Language‑Action (VLA) モデルSmolVLAをSO‑101ロボットアーム上で非同期推論してみた結果と、その仕組みをア…

4ヶ月前

ロボティクス開発における学習用データ不足問題の解決手段？NVIDIA の「Isaac Sim & Lab」を使用してシミュレーター上で学習用データセットを生成する

ABEJA Tech Blog

こんにちは！ABEJA で ABEJA Platform 開発を行っている坂井（@Yagami360）です。先日の記事では、NVIDIA のロボティクス用３Dシミュレーター「Isaac Sim & Lab」を使用して、物理演算が考慮された3Dシミュレーター上でロボティクスモデルを学習させたり推論させたりしながらロボットを動かす方法を紹介しました。 tech-blog.abeja.asia 今回の記事では、同じく Isaac Sim & Lab を使用して、シミュレーター上でのロボット遠隔操作や Isaac Lab Mimic により、ロボティクスモデルの学習用データセットを生成したり、生成し…

4ヶ月前

宣言的AIコーディングのススメ

ABEJA Tech Blog

こんにちは。CTO室の村主です。 Claude Codeを日々使う中で思っていることをGeminiに言語化してもらいました。 Gemini製作物ですので、超最新トレンドを掴んでいなかったり、書き味がイマイチなところも敢えて残していますので、読み物として楽しんでください。宣言的AIコーディングのススメ AIがコードを書く時代が本格的に到来しつつあります。しかし、「AIにコードを書かせたけどうまくいかない」「毎回指示の仕方に悩む」といった声も聞かれるのではないでしょうか。その問題の根底には、AIへの「指示の出し方」があるのかもしれません。この記事では、AIコーディングの効率と品質を劇的に向上さ…

4ヶ月前

SO‑101アームで卵を搬送！TPU製グリッパーの実力を測る

ABEJA Tech Blog

はじめに TPUフィラメントとは TPU製コンプライアントグリッパーの設計グリッパーのプリントと完成品卵の把持・搬送を実験タスク設計実験結果考察とまとめ We Are Hiring! はじめにこんにちは！ABEJAでエンジニアをしている宇留嶋です。今回は、SO‑101ロボットアームのグリッパー先端（エンドエフェクター）を柔軟性の高いTPUフィラメントで3Dプリントし、「卵をつかんでも殻が割れない」コンプライアントグリッパーを作成しました。柔らかい指先を与えることで高精度な制御がなくても扱えるようになり、その効果をPLA製グリッパーと比較した結果を紹介します。 SO‑101アームの組…

4ヶ月前

NVIDIA のロボティクス用３Dシミュレーター「Isaac Sim & Lab」でロボットを動かす on Ubuntu Server

ABEJA Tech Blog

こんにちは！ABEJA で ABEJA Platform 開発を行っている坂井（@Yagami360）です。先日の記事では、いずれも Gymnasium というライブラリを使用して簡易的な環境でモデルを推論させながらロボットを動かしてみました。 tech-blog.abeja.asia tech-blog.abeja.asia しかしながら実際のロボティクス開発においては、できるだけ現実世界に近くなるように物理演算が考慮された3Dシミュレーター上で動かしながらシミュレーションする必要があります。このような3Dシミュレーターには、MuJoCo, Isaac Sim, Genesis, Pyb…

4ヶ月前

ロボティクスモデルの精度向上の挑戦　〜前処理モデル追加編（深度推定による精度向上）〜

ABEJA Tech Blog

こちらは「ロボティクスモデルの精度向上の挑戦」の後編記事になります。前編は以下の記事をご参照ください。 tech-blog.abeja.asia 前編では、データオーギュメントの改善によりモデルの汎化性能を向上させることを実現しましたが、今回の記事では前処理モデルを追加することにより、モデルの Max 品質を向上させることを目指します。前処理モデル追加によるモデル改善深度マップ用の前処理モデル追加まとめ We Are Hiring! 前処理モデル追加によるモデル改善今回の方法では、コアのAIモデル（今回の場合はロボティクスモデル）とは別の前処理用のAIモデルを追加する方法でのモデル改…

4ヶ月前

ロボティクスモデルの精度向上の挑戦　〜データ拡張（Data Augmentation）編〜

ABEJA Tech Blog

こんにちは！ABEJA で ABEJA Platform 開発を行っている坂井（@Yagami360）です。先日の記事で、LeRobot で公開されているロボティクス領域の VLA モデル「π0」をファインチューニングした上で Gymnasium シミュレーター環境上で動かす方法を解説しました。 tech-blog.abeja.asia 前回の記事では、ただ単に公開されている学習用データセットでモデルをファインチューニングして推論させるだけの簡単な内容でしたが、今回はもう少し踏み込んでモデル自体の改善をやってみようと思います。また前回はロボティクスモデルとして π0 モデルを動かしましたが…

4ヶ月前

LeRobot Worldwide HackathonにABEJAチームとして参加しました

ABEJA Tech Blog

2025年6月14日から15日にかけて、LeRobot Worldwide Hackathonが開催され、ABEJAのロボット好きメンバーも参加しました！このハッカソンでの挑戦内容や学びについてまとめていきます。そもそもLeRobotとは LeRobotは、Hugging Face社が主導するオープンソースのロボティクスフレームワークです。フレームワークといってもその範囲はソフトだけでなくハードにまで及び、学習済みモデルだけでなく、そのデータセットやシミュレーター、学習用のパイプライン、そしてSO-101ロボットアームなどの公開されたハードウェアで構成されます。従来のルールベースやモデル…

4ヶ月前

今すぐ動かせるROS Noetic

ABEJA Tech Blog

ABEJA 新卒エンジニアの和田です。ロボット開発では、各種センサやアクチュエータ、制御アルゴリズムなどを組み合わせる必要があります。ROS（Robot Operating System）はこうした複雑な要素を「分散システム」としてまとめ、開発を効率化するための通信ミドルウェア的フレームワークです。ROS 1 Noetic は公式サポートが2025年5月に終了しており、ROS 2は進化したリアルタイム制御やマルチプラットフォーム対応、セキュリティ強化が魅力です。まずはROS 1 Noeticを理解することで、ROSの基本的な概念や開発フローを学びやすいため、本記事ではROS 1 Noetic…

5ヶ月前

15分で作るSO-ARMシミュレーション環境（MuJoCo)　

ABEJA Tech Blog

ABEJA 新卒エンジニアの和田です。 LeRobot Worldwide Hackathonに ABEJA の有志チームとして参加しました。ハッカソンでは模倣学習をテーマにロボットアームの動作を再現したかったのですが、実機を揃えられなかったため、MuJoCo 上でのシミュレーション環境構築を試みました。本記事では、macOS 環境でオープンソースのロボットアーム「SO-101」を MuJoCo 上で動かすセットアップ手順をご紹介します。実機をお持ちでない方でも、手軽にシミュレーションを始められるよう、スクリーンショットやコマンドを交えて丁寧に解説します。 huggingface.co 前提と…

5ヶ月前