Taste of Tech Topics
https://acro-engineer.hatenablog.com/
Acroquest Technology株式会社のエンジニアが書く技術ブログ
フィード

Azure AI SearchのAgentic Retrievalを使ってAgentic RAG実現
9
Taste of Tech Topics
こんにちは、2年目エンジニアの飯棲です。 すっかり暖かくなり春本番ですね。 オフィス近くの公園に咲く桜がとても綺麗でした。 今回は、Microsoft Azureのプレビューとして新たに追加されたAgentic Retrieval について紹介します。 これにより、RAG を備えたエージェントを簡単に作成できるようになりました。 1. はじめに 2. AI SearchのAgentic Retrievalについて 2.1 何ができるか 2.2 Output Mode 2.3 Reasoning Effort 3. 試してみる 3.1 今回やること リソース作成 Azure AI Searchイ…
3日前

WrenAI で手軽に Generative BI を実現
Taste of Tech Topics
こんにちは。大橋です。 3月も終わりを迎え、近くの川辺では桜がちょうど見ごろになりました。 春のやわらかな空気に包まれながら、新しい季節の訪れをしみじみ感じる頃ですね。 ところで、みなさんはビジネスデータを分析する際、SQLを書いたり、BIツールの集計条件を何度も調整したりする作業に時間を取られたことはないでしょうか。 このようなデータ分析も、生成AIを利用して、自然言語でいい感じにデータを分析できたら良いですよね。 そのような内容を、最近では、生成AIとBIツールを掛けて「Generative BI」という言い方をします。 今回、OSSのGenerative BIツールである「WrenAI」…
18日前

Strands Agents + AG-UIで Human-in-the-Loop付きのAIエージェントを実現する
Taste of Tech Topics
こんにちは。データ分析エンジニアの木介です。 AIエージェントを導入し、業務の自動化を進めていくと、「重要な操作には人による承認を挟みたい」というケースが出てきます。 今回は、Strands Agentsのinterrupt機能とAG-UIプロトコルを組み合わせて、Human-in-the-Loop(HITL)付きの調査レポート作成エージェントを実現してみます。 github.com strandsagents.com 1. はじめに 2. AG-UI × HITL 2.1. AG-UIとは 2.2. Human-in-the-Loopとは 2.3. 今回実現するアプリイメージ 構成 3. 実…
21日前

Amazon Bedrock AgentCore Memory のエピソード戦略で経験を元にしたナレッジ活用
Taste of Tech Topics
こんにちは、丸山です。 2月後半に入って、急に暖かい日が増えてきましたが、それに伴い、花粉症が辛くなってきました(涙)。 本記事では Amazon Bedrock AgentCore Memoryのエピソード戦略を取り上げます。 他の記憶戦略と比較しながら、どのような情報が保存され、どんな場面で有効なのかを実例ベースで確認していきます。 1. AgentCoreとは 2. AgentCore Memoryとは 2.1. 短期記憶と長期記憶 2.2. 長期記憶の記憶戦略 エピソード戦略が保存する記憶情報 エピソード戦略が有効なユースケース 2.3. コスト 3. 実装と検証 3.1. メモリ作成…
2ヶ月前

AIエージェントのUXを進化させる「A2UI」でアプリを構築
Taste of Tech Topics
こんにちは。大塚です。 普段は生成AIを利用したサービスの開発に携わっているのですが、直近の仕事では、数理最適化の手法を扱う機会がありました。 実は、大学の授業で数理最適化をかじっており、教授がよく 「人の勘や経験に頼っている部分を数式に落とし込むことで、合理的な意思決定ができるようにしよう。」 といっていたことを思い出しました。 まさに今、それを仕事で実践できており、面白くなってきました。 さて、今回のテーマは最適化ではなく、AIエージェントのUIについてです。 現在の生成AIアプリのUIといえば、「チャット」形式がほとんどの状況だと思いますが、チャットのアプリは汎用的な一方で、入力を制御し…
2ヶ月前

Amazon Bedrock AgentCore ObservabilityでStrands Agentsを可視化する
Taste of Tech Topics
こんにちは、YAMALEX駿です。 YAMALEX は Acroquest 社内で発足した、会社の未来の技術を創る、機械学習がメインテーマのデータサイエンスチームです。 (詳細はリンク先をご覧ください。) AIエージェントの開発において、本番環境での動作を監視し、パフォーマンスを測定・デバッグすることは非常に重要です。 Amazon Bedrock AgentCore Observability を活用することで、エージェントの動作を詳細に追跡し、問題を迅速に特定できるようになります。 本記事では、Strands Agentsフレームワークを使用して、OpenTelemetryによる自動計装を…
2ヶ月前

Lambda Durable Functions で Human-in-the-Loop なAIエージェントを実装する!
Taste of Tech Topics
1.はじめに こんにちはデータ分析エンジニアの木介です。 今回は2025年12月にAWSより発表された Lambda Durable Functions を使って Human-in-the-Loop なAgentの構成を紹介します。 Lambda Durable Functions を使うと、複数ステップの処理を 最大1年間 継続できます。 また、承認待ちのように処理を進められない間はLambdaの実行を一度止めた状態で待機でき、その間は実行時間として扱われません。 そのため、Human-in-the-Loop のように「数時間〜数日待つ」ワークフローでも、サーバレスのまま実装しやすくなります…
3ヶ月前

時系列基盤モデルChronos-2による時系列予測を試してみた
Taste of Tech Topics
こんにちは、コバタカです。 最近はAIエージェントを使って、作って、楽しんでいます。LLMと同様、時系列予測においても基盤モデルの活用が近年進んでいます。 今回紹介するChronos-2は、AmazonがOSSとして公開している時系列データ処理向けの基盤モデルです。 以前、本ブログでChronos-Boltの紹介がありましたが、Chronos-2はその後継モデルとなります。 様々な時系列データに対応するように学習されており、ZeroShotでも高い精度での予測が可能となっているモデルです。 この記事では、そのChronos-2について紹介していきます。 なお、Chronos-Boltの解説につ…
3ヶ月前

Amazon Bedrock AgentCore で A2Aマルチエージェントを構成する
Taste of Tech Topics
こんにちは、丸山です。 最近、AgentCoreを利用する仕事が増え、日々いろいろな利用方法を調べています。 さて、AgentCoreは、2025年7月にプレビュー公開されて以降、10月には一般提供開始(GatewayのMCP対応/Memoryの長期記憶対応など)、12月にはさらに機能追加がされ(Evaluations/Policy)、あっという間にアップデートされていきますね。 さて今回は、AgentCore Runtime が対応している A2A(Agent2Agent)プロトコルに注目します。 A2A を利用することで、エージェント同士を標準化されたプロトコルで連携させることができます。…
3ヶ月前

LLMサービングライブラリの LMDeploy と vLLM を比較した
Taste of Tech Topics
皆さんこんにちは。 Acroquest のデータサイエンスチーム「AcroYAMALEX」を率いるチームリーダー、@tereka114です。 AcroYAMALEX では、コンペティション参加・自社製品開発・技術研究に日々取り組んでいます。チーム紹介はこちら。本記事は、「学習推論ライブラリ・フレームワーク Advent Calendar 2025」の25日目です。 qiita.comLLMは相変わらず新しいモデルが登場し世間を賑わせています。 しかし、モデル自体が重く、計算時間がかかります。そのため、LLMの推論では計算速度が重要となります。 「vLLM」では、LLMを効率的に推論する技術を用…
4ヶ月前

Elasticsearchにおける日付範囲検索時の落とし穴
Taste of Tech Topics
こんにちは。Elasticsearchテクニカルコンサルタントの江見です。この記事は、Elastic Stack (Elasticsearch) Advent Calendar 2025の24日目の記事です。ログの検索、売上データ、ユーザの行動履歴など、業務システムでタイムスタンプの範囲検索はほぼ必須の機能になります。 特に日単位で範囲指定をする場合は、yyyy-MM-ddのように日付のみを指定するのが人間にとっては直感的にわかりやすいと思います。Elasticsearchで範囲検索を行う場合は、rangeクエリを使用するのが一般的ですが、yyyy-MM-ddの形式のままrangeクエリを使用…
4ヶ月前

Elasticsearchのリランク最新事情
Taste of Tech Topics
こんにちは、@shin0higuchi です😊 この記事は、Elastic Stack (Elasticsearch) Advent Calendar 2025の23日目の記事です。昨年のアドベントカレンダーでは、Elasticsearchを用いたRAGに関する記事を執筆しました。 acro-engineer.hatenablog.comこの1年でElasticsearchの inference API と retriever はさらに成熟し、実戦投入しやすい状態になりました。今回は、重要要素の1つであるリランクについて、Elasticsearchで現状できることを整理します。 2つの選択肢:…
4ヶ月前

StrandsAgents + Nova 2 Sonic + Bedrock Knowledge Base で対話型アシスタントを作成する
Taste of Tech Topics
この記事は、以下の Advent Calendar の 18 日目における投稿です。 Japan AWS Top Engineers - Qiita Advent Calendar 2025 - Qiita AIエージェント構築&運用 - Qiita Advent Calendar 2025 - Qiita こんにちは、 YAMALEX の駿です。 今回は re:Invent で発表された Amazon Nova 2 Sonic と StrandsAgents の新機能である Bidirectional Agent を使って、 音声対話をとおして Bedrock Knowledge Base …
4ヶ月前

Amazon Bedrock AgentCore で実現する「Code excecution with MCP」
Taste of Tech Topics
この記事は AI Agent on AWS - Qiita Advent Calendar 2025 - Qiita 16日目の記事です。 1. はじめに こんにちは。データ分析エンジニアの木介です。 Anthropic が公開した「Code execution with MCP: building more efficient AI agents」では、MCP(Model Context Protocol)とコード実行環境を組み合わせて、コンテキスト消費を抑えながらツールを使うための新しい設計パターンとして Code execution with MCP が紹介されました。 今回は、この C…
4ヶ月前

日本初開催!OpenSearch Con Japan 2025 へ行ってきた
Taste of Tech Topics
こんにちは。 Acroquestのデータサイエンスチーム「YAMALEX」に所属する@shin0higuchiです😊 YAMALEXチームでは、コンペティションへの参加や自社製品開発、技術研究などに日々取り組んでいます。2025年12月11日(木)、東京で開催された OpenSearch Con Japan 2025 に参加してきました。 events.linuxfoundation.org私は普段 OpenSearch/Elasticsearchなどを利用した検索サービスの開発やチューニングなどに携わっているので、今回のイベントはとても楽しみにしていました。 この記事では、イベント全体の雰囲…
4ヶ月前

AWSでElastic Cloudを利用する 2025年12月版(構築編)
Taste of Tech Topics
AWS Marketplaceを利用してElastic Cloudを構築し、その後Security設定/認証設定を実施する手順を紹介します。
4ヶ月前

Amazon Bedrock の「gpt-oss」の日本語精度を評価する記事をAWSブログに寄稿しました
Taste of Tech Topics
皆さんこんにちは。 Acroquest のデータサイエンスチーム「AcroYAMALEX」を率いるチームリーダー、@tereka114です。 AcroYAMALEX では、コンペティション参加・自社製品開発・技術研究に日々取り組んでいます(チーム紹介は こちら )。 生成AIモデルの多くは、提供元のベンダーが学習させたものを利用するのが一般的だと思いますが(クローズドな状態)、 最近、「オープンウェイトモデル」というものが注目されています。 これは、モデルのパラメータが公開されているため、利用者が変更・調整できるもので、ファインチューニングよりも簡単に様々な環境でチューニングが可能になります。…
5ヶ月前

Amazon Bedrock AgentCore で Lambda でAIエージェントを開発してみた(MCPで内部連携あり)
Taste of Tech Topics
こんにちは、丸山です。 2025/10/13に、Amazon Bedrock AgentCore がついに一般公開(Generally Available)となりました! もちろん、東京リージョンでも利用可能になっています。 「今年の re:Ivent に合わせて、12月ごろにGAかな」と勝手に予想していたのですが、見事に裏切られましたね。 aws.amazon.com ということで、早速、Amazon Bedrock AgentCore で、AIエージェントを開発した内容を紹介してみたいと思います。 1. はじめに 1.1 Amazon Bedrock AgentCoreとは 1.2 Age…
6ヶ月前

RAGにおけるハイブリッド検索対決! OpenSearch Serverless VS Aurora Serverless
Taste of Tech Topics
はじめに こんにちは。データ分析エンジニアの木介です。 今回はAmazon Bedrock Knowledge BasesベクトルDB(検索エンジン)として利用できるものの比較を行っていきたいと思います。 前回はS3 VectorsとOpenSearch Serverlessの比較を行いましたが、ハイブリッド検索が必要な内容だと、精度の差が大きく出ました。acro-engineer.hatenablog.com現状、Bedrock Knowledge Base でハイブリッド検索に対応しているのは、以下のベクトルDBがあります。 OpenSearch Serverless OpenSearch…
6ヶ月前

StrandsAgents+AgentCore Memory で私好みのエージェントを実現する
Taste of Tech Topics
こんにちは、YAMALEXの駿です。 昨今、対話型AIの活用が進む中で、ユーザーごとにパーソナライズされた体験を提供することが、より重要になっています。 単なる一問一答ではなく、「ユーザーが誰で、どんな関心や目的を持っているか」を理解したうえで応答できるエージェントが求められています。 本記事では、Strands AgentsとBedrock AgentCoreを組み合わせて、ユーザーとの対話履歴を記憶・活用するパーソナライズ型エージェントの実装と検証を行います。 1. はじめに 1.1. Strands Agentsとは 1.1.1. Strands Agents Tools 1.2. Be…
7ヶ月前

GPT-5の出力形式をCFGを使って強制する
Taste of Tech Topics
こんにちは。新人エンジニアの飯棲です。本記事ではGPT-5で新しく導入された新しいパラメータの一つであるCFGについて紹介します。 CFGはLark文法や正規表現によってモデルの回答の出力形式を制限できる便利な機能です。 1. はじめに 2. GPT-5の新機能、CFGパラメータについて 1. 何ができるか 2. 注意事項 3. 試してみる 1. 今回やること 2. Lark文法を定義する 3. CFGに設定してGPT-5を実行する 4. 色々なパターンを試す シンプルなパターン 複雑なパターン 逸脱したパターン 4. まとめ 1. はじめに GPT-5からはリクエスト時に指定できるパラメータ…
7ヶ月前

StrandsAgents + Claude インターリーブ思考でDeepResearchを実現する
Taste of Tech Topics
こんにちは、YAMALEXの駿です。 最近はStrandsAgentsとStrandsAgents Toolsを組み合わせていろいろなエージェントを作るのにはまっています。 今回は StrandsAgents と Claude 4 のインターリーブ思考 を組み合わせ、マルチエージェントなし で Deep Research 相当の調査レポートを生成する手法を紹介します。 1. はじめに 1.1. DeepResearchについて 1.2. StrandsAgentsとは インターリーブ思考とは 2. 実装 2.1. エージェント 2.2. モデル(インターリーブ思考を有効にする) ポイント 2.…
8ヶ月前

ACL2025@ウィーンに現地参加しました
Taste of Tech Topics
こんにちは。ウィーンから日本に帰ってきたら暑すぎて体が追い付かないSsk1029Takashiです。今回は2025/7/27~8/1にウィーンで開催されているACL2025(The 63rd Annual Meeting of the Association for Computational Linguistics)に現地参加したので、その参加報告記事になります。 聴講参加でしたが、NLPの最先端を追えた素晴らしい機会でした。 (私は日程の都合で7/31までの参加でした。) ACLとは? 学会の様子 特に気になったセッション、論文 Tutorial: Uncertainty Quantifi…
8ヶ月前

Amazon S3 Vectors によるRAGの性能/精度を評価してみた
Taste of Tech Topics
はじめに こんにちは。データ分析エンジニアの木介です。 今回は、AWS Summit 2025 New Yorkにて発表されたS3 Vectorsについて、既存のベクトルストレージとの比較も含めて紹介していきたいと思います。 aws.amazon.com はじめに S3 Vectorsとは 1. 他ベクトルストレージとのコスト面での比較 2. 機能面での制限事項 3. S3 Vectorsのベストプラクティス 他ベクトルストレージとの速度面での比較 他ベクトルストレージとの精度面での比較 1. ベクトル検索による精度比較 2. ハイブリッド検索との精度比較 まとめ S3 Vectorsとは A…
9ヶ月前

DifyのReActを用いてナレッジ/記事要約エージェントを作ってみた
Taste of Tech Topics
皆さんこんにちは。バックエンドエンジニアの前田です。 最近は、いよいよ暑さが本気を出してきたので、熱中症対策をしなくては、と考えています。さて、今回はDifyのv1.0.0で追加されたReActを用いてナレッジ/記事要約エージェントを作成しました。 ナレッジに登録したドキュメントなどをもとに、Web検索もして情報を補足し、文章を要約するエージェントが欲しいと思い、作ってみました。Difyの環境構築と基本的な使い方については以下の記事を参考にしてみてください。 今回はDifyのv1.6.0を用いて作成しました。 acro-engineer.hatenablog.com 1. DifyにおけるRe…
9ヶ月前

Amazon Bedrock のプロンプトキャッシュはコスト/レイテンシーにどのような効果があるか?
Taste of Tech Topics
はじめに こんにちは、丸山です。LLMやナレッジベースの利用ができるサービス「Amazon Bedrock」の新機能として、2025/04/07に「プロンプトキャッシュ」が一般公開されました。 aws.amazon.com aws.amazon.com この機能により、LLM利用時のコスト削減とレイテンシー改善ができます。 今回は、プロンプトキャッシュを使用することで実際どの程度コスト削減やレイテンシー改善ができるのか試してみました。 はじめに プロンプトキャッシュのメリット プロンプトキャッシュの仕組み ざっと知りたい人向けの説明 詳しく知りたい人向けの説明 どのようなときに使うとよいか プ…
9ヶ月前

OpenSearch 3.0 でMCPによるAgentとの連携を行ってみる
Taste of Tech Topics
はじめに こんにちは。データ分析エンジニアの木介です。 今回は、OpenSearch 3.0の最新リリースについての紹介と、新たに対応したMCP(Model Context Protocol)を用い外部リソースとOpenSearchの連携方法について解説していきます。 opensearch.orgOpenSearchでのMCPの利用方法は、以下の2つの構成があります。構成①:OpenSearchからMCPを利用する OpenSearch内でMCPクライアント/サーバーを構築し、ユーザーからの検索内容に応じてMCP経由でリソースを利用する方法。 構成➁:MCPサーバーからOpenSearchを呼…
10ヶ月前

DifyワークフローでDeepResearchを実現する
Taste of Tech Topics
こんにちは、クラウドエンジニアの青山です。 最近、何か調べたいときには、通常の検索エンジンではなく、生成AIに聞くことが習慣になってきています。 調べたいことが分かりやすく得られるので、最近の生成AIの発展には、驚くばかりです。とはいえ、単純な検索ではなく、関係するような情報をいろいろ調べたりするのは、生成AIを使っても時間がかかりますよね。 そこで有用なのが、ユーザーの質問に対して、より広く深く考察しながら、回答をしてくれる「DeepResearch」だと思います。 いろいろな生成AIサービスで、この機能が登場してきていますが、今回この「DeepResearch」の機能を、Difyを使って実…
1年前

Cline × Amazon Bedrock でCRUDアプリのフルスタック開発をやってみた
Taste of Tech Topics
はじめに こんにちは一史です。 先日神代植物公園に行きました、まだ藤の花が残っておりとても綺麗で癒されました。昨今、開発支援のAIエージェントとしてClineが話題になっています。 github.comClineはVisual Studio Code(VSCode)の拡張機能であり、単なるコード生成だけでなく、コマンド実行や動作確認・デバッグまでを一貫して行ってくれる点が特徴です。Clineは任意の生成AIモデルを指定し、コードを生成させることができます。 このためセキュアで実際の開発現場でも活用されるAmazon Bedrockと組み合わせることでビジネスシーンでの活用も可能となります。 今…
1年前

Azure AI FoundryのServerless APIでPhi-4-miniを簡単にFine Tuningする
Taste of Tech Topics
こんにちは。データサイエンスチームYAMALEXの@Ssk1029Takashiです。 (YAMALEXについて詳細はこちらをぜひご覧下さい。) www.acroquest.co.jpつい先日Phi-4-reasoningというモデルがMicrosoftから発表されました。 軽量な事前学習済み言語モデル(SLM)も性能が上がってきて利用されることが増えてきています。 SLM は量子化などを施すことで、ハイエンド GPU を使わずとも動かせる点が利点です。 そのため、外に出せないデータを扱ったり、通信できない環境で利用されることが多いとされています。SLMを扱う場合に必要になるのはFine Tu…
1年前