Taste of Tech Topics
https://acro-engineer.hatenablog.com/
Acroquest Technology株式会社のエンジニアが書く技術ブログ
フィード

Amazon Bedrock AgentCore Memory のエピソード戦略で経験を元にしたナレッジ活用
24
Taste of Tech Topics
こんにちは、丸山です。 2月後半に入って、急に暖かい日が増えてきましたが、それに伴い、花粉症が辛くなってきました(涙)。 本記事では Amazon Bedrock AgentCore Memoryのエピソード戦略を取り上げます。 他の記憶戦略と比較しながら、どのような情報が保存され、どんな場面で有効なのかを実例ベースで確認していきます。 1. AgentCoreとは 2. AgentCore Memoryとは 2.1. 短期記憶と長期記憶 2.2. 長期記憶の記憶戦略 エピソード戦略が保存する記憶情報 エピソード戦略が有効なユースケース 2.3. コスト 3. 実装と検証 3.1. メモリ作成…
3日前

AIエージェントのUXを進化させる「A2UI」でアプリを構築
Taste of Tech Topics
こんにちは。大塚です。 普段は生成AIを利用したサービスの開発に携わっているのですが、直近の仕事では、数理最適化の手法を扱う機会がありました。 実は、大学の授業で数理最適化をかじっており、教授がよく 「人の勘や経験に頼っている部分を数式に落とし込むことで、合理的な意思決定ができるようにしよう。」 といっていたことを思い出しました。 まさに今、それを仕事で実践できており、面白くなってきました。 さて、今回のテーマは最適化ではなく、AIエージェントのUIについてです。 現在の生成AIアプリのUIといえば、「チャット」形式がほとんどの状況だと思いますが、チャットのアプリは汎用的な一方で、入力を制御し…
20日前

Amazon Bedrock AgentCore ObservabilityでStrands Agentsを可視化する
Taste of Tech Topics
こんにちは、YAMALEX駿です。 YAMALEX は Acroquest 社内で発足した、会社の未来の技術を創る、機械学習がメインテーマのデータサイエンスチームです。 (詳細はリンク先をご覧ください。) AIエージェントの開発において、本番環境での動作を監視し、パフォーマンスを測定・デバッグすることは非常に重要です。 Amazon Bedrock AgentCore Observability を活用することで、エージェントの動作を詳細に追跡し、問題を迅速に特定できるようになります。 本記事では、Strands Agentsフレームワークを使用して、OpenTelemetryによる自動計装を…
1ヶ月前

Lambda Durable Functions で Human-in-the-Loop なAIエージェントを実装する!
Taste of Tech Topics
1.はじめに こんにちはデータ分析エンジニアの木介です。 今回は2025年12月にAWSより発表された Lambda Durable Functions を使って Human-in-the-Loop なAgentの構成を紹介します。 Lambda Durable Functions を使うと、複数ステップの処理を 最大1年間 継続できます。 また、承認待ちのように処理を進められない間はLambdaの実行を一度止めた状態で待機でき、その間は実行時間として扱われません。 そのため、Human-in-the-Loop のように「数時間〜数日待つ」ワークフローでも、サーバレスのまま実装しやすくなります…
1ヶ月前

時系列基盤モデルChronos-2による時系列予測を試してみた
Taste of Tech Topics
こんにちは、コバタカです。 最近はAIエージェントを使って、作って、楽しんでいます。LLMと同様、時系列予測においても基盤モデルの活用が近年進んでいます。 今回紹介するChronos-2は、AmazonがOSSとして公開している時系列データ処理向けの基盤モデルです。 以前、本ブログでChronos-Boltの紹介がありましたが、Chronos-2はその後継モデルとなります。 様々な時系列データに対応するように学習されており、ZeroShotでも高い精度での予測が可能となっているモデルです。 この記事では、そのChronos-2について紹介していきます。 なお、Chronos-Boltの解説につ…
2ヶ月前

Amazon Bedrock AgentCore で A2Aマルチエージェントを構成する
Taste of Tech Topics
こんにちは、丸山です。 最近、AgentCoreを利用する仕事が増え、日々いろいろな利用方法を調べています。 さて、AgentCoreは、2025年7月にプレビュー公開されて以降、10月には一般提供開始(GatewayのMCP対応/Memoryの長期記憶対応など)、12月にはさらに機能追加がされ(Evaluations/Policy)、あっという間にアップデートされていきますね。 さて今回は、AgentCore Runtime が対応している A2A(Agent2Agent)プロトコルに注目します。 A2A を利用することで、エージェント同士を標準化されたプロトコルで連携させることができます。…
2ヶ月前

LLMサービングライブラリの LMDeploy と vLLM を比較した
Taste of Tech Topics
皆さんこんにちは。 Acroquest のデータサイエンスチーム「AcroYAMALEX」を率いるチームリーダー、@tereka114です。 AcroYAMALEX では、コンペティション参加・自社製品開発・技術研究に日々取り組んでいます。チーム紹介はこちら。本記事は、「学習推論ライブラリ・フレームワーク Advent Calendar 2025」の25日目です。 qiita.comLLMは相変わらず新しいモデルが登場し世間を賑わせています。 しかし、モデル自体が重く、計算時間がかかります。そのため、LLMの推論では計算速度が重要となります。 「vLLM」では、LLMを効率的に推論する技術を用…
2ヶ月前

Elasticsearchにおける日付範囲検索時の落とし穴
Taste of Tech Topics
こんにちは。Elasticsearchテクニカルコンサルタントの江見です。この記事は、Elastic Stack (Elasticsearch) Advent Calendar 2025の24日目の記事です。ログの検索、売上データ、ユーザの行動履歴など、業務システムでタイムスタンプの範囲検索はほぼ必須の機能になります。 特に日単位で範囲指定をする場合は、yyyy-MM-ddのように日付のみを指定するのが人間にとっては直感的にわかりやすいと思います。Elasticsearchで範囲検索を行う場合は、rangeクエリを使用するのが一般的ですが、yyyy-MM-ddの形式のままrangeクエリを使用…
2ヶ月前

Elasticsearchのリランク最新事情
Taste of Tech Topics
こんにちは、@shin0higuchi です😊 この記事は、Elastic Stack (Elasticsearch) Advent Calendar 2025の23日目の記事です。昨年のアドベントカレンダーでは、Elasticsearchを用いたRAGに関する記事を執筆しました。 acro-engineer.hatenablog.comこの1年でElasticsearchの inference API と retriever はさらに成熟し、実戦投入しやすい状態になりました。今回は、重要要素の1つであるリランクについて、Elasticsearchで現状できることを整理します。 2つの選択肢:…
2ヶ月前

StrandsAgents + Nova 2 Sonic + Bedrock Knowledge Base で対話型アシスタントを作成する
Taste of Tech Topics
この記事は、以下の Advent Calendar の 18 日目における投稿です。 Japan AWS Top Engineers - Qiita Advent Calendar 2025 - Qiita AIエージェント構築&運用 - Qiita Advent Calendar 2025 - Qiita こんにちは、 YAMALEX の駿です。 今回は re:Invent で発表された Amazon Nova 2 Sonic と StrandsAgents の新機能である Bidirectional Agent を使って、 音声対話をとおして Bedrock Knowledge Base …
2ヶ月前

Amazon Bedrock AgentCore で実現する「Code excecution with MCP」
Taste of Tech Topics
この記事は AI Agent on AWS - Qiita Advent Calendar 2025 - Qiita 16日目の記事です。 1. はじめに こんにちは。データ分析エンジニアの木介です。 Anthropic が公開した「Code execution with MCP: building more efficient AI agents」では、MCP(Model Context Protocol)とコード実行環境を組み合わせて、コンテキスト消費を抑えながらツールを使うための新しい設計パターンとして Code execution with MCP が紹介されました。 今回は、この C…
3ヶ月前

日本初開催!OpenSearch Con Japan 2025 へ行ってきた
Taste of Tech Topics
こんにちは。 Acroquestのデータサイエンスチーム「YAMALEX」に所属する@shin0higuchiです😊 YAMALEXチームでは、コンペティションへの参加や自社製品開発、技術研究などに日々取り組んでいます。2025年12月11日(木)、東京で開催された OpenSearch Con Japan 2025 に参加してきました。 events.linuxfoundation.org私は普段 OpenSearch/Elasticsearchなどを利用した検索サービスの開発やチューニングなどに携わっているので、今回のイベントはとても楽しみにしていました。 この記事では、イベント全体の雰囲…
3ヶ月前

AWSでElastic Cloudを利用する 2025年12月版(構築編)
Taste of Tech Topics
AWS Marketplaceを利用してElastic Cloudを構築し、その後Security設定/認証設定を実施する手順を紹介します。
3ヶ月前

Amazon Bedrock の「gpt-oss」の日本語精度を評価する記事をAWSブログに寄稿しました
Taste of Tech Topics
皆さんこんにちは。 Acroquest のデータサイエンスチーム「AcroYAMALEX」を率いるチームリーダー、@tereka114です。 AcroYAMALEX では、コンペティション参加・自社製品開発・技術研究に日々取り組んでいます(チーム紹介は こちら )。 生成AIモデルの多くは、提供元のベンダーが学習させたものを利用するのが一般的だと思いますが(クローズドな状態)、 最近、「オープンウェイトモデル」というものが注目されています。 これは、モデルのパラメータが公開されているため、利用者が変更・調整できるもので、ファインチューニングよりも簡単に様々な環境でチューニングが可能になります。…
3ヶ月前

Amazon Bedrock AgentCore で Lambda でAIエージェントを開発してみた(MCPで内部連携あり)
Taste of Tech Topics
こんにちは、丸山です。 2025/10/13に、Amazon Bedrock AgentCore がついに一般公開(Generally Available)となりました! もちろん、東京リージョンでも利用可能になっています。 「今年の re:Ivent に合わせて、12月ごろにGAかな」と勝手に予想していたのですが、見事に裏切られましたね。 aws.amazon.com ということで、早速、Amazon Bedrock AgentCore で、AIエージェントを開発した内容を紹介してみたいと思います。 1. はじめに 1.1 Amazon Bedrock AgentCoreとは 1.2 Age…
4ヶ月前

RAGにおけるハイブリッド検索対決! OpenSearch Serverless VS Aurora Serverless
Taste of Tech Topics
はじめに こんにちは。データ分析エンジニアの木介です。 今回はAmazon Bedrock Knowledge BasesベクトルDB(検索エンジン)として利用できるものの比較を行っていきたいと思います。 前回はS3 VectorsとOpenSearch Serverlessの比較を行いましたが、ハイブリッド検索が必要な内容だと、精度の差が大きく出ました。acro-engineer.hatenablog.com現状、Bedrock Knowledge Base でハイブリッド検索に対応しているのは、以下のベクトルDBがあります。 OpenSearch Serverless OpenSearch…
5ヶ月前

StrandsAgents+AgentCore Memory で私好みのエージェントを実現する
Taste of Tech Topics
こんにちは、YAMALEXの駿です。 昨今、対話型AIの活用が進む中で、ユーザーごとにパーソナライズされた体験を提供することが、より重要になっています。 単なる一問一答ではなく、「ユーザーが誰で、どんな関心や目的を持っているか」を理解したうえで応答できるエージェントが求められています。 本記事では、Strands AgentsとBedrock AgentCoreを組み合わせて、ユーザーとの対話履歴を記憶・活用するパーソナライズ型エージェントの実装と検証を行います。 1. はじめに 1.1. Strands Agentsとは 1.1.1. Strands Agents Tools 1.2. Be…
5ヶ月前

GPT-5の出力形式をCFGを使って強制する
Taste of Tech Topics
こんにちは。新人エンジニアの飯棲です。本記事ではGPT-5で新しく導入された新しいパラメータの一つであるCFGについて紹介します。 CFGはLark文法や正規表現によってモデルの回答の出力形式を制限できる便利な機能です。 1. はじめに 2. GPT-5の新機能、CFGパラメータについて 1. 何ができるか 2. 注意事項 3. 試してみる 1. 今回やること 2. Lark文法を定義する 3. CFGに設定してGPT-5を実行する 4. 色々なパターンを試す シンプルなパターン 複雑なパターン 逸脱したパターン 4. まとめ 1. はじめに GPT-5からはリクエスト時に指定できるパラメータ…
5ヶ月前

StrandsAgents + Claude インターリーブ思考でDeepResearchを実現する
Taste of Tech Topics
こんにちは、YAMALEXの駿です。 最近はStrandsAgentsとStrandsAgents Toolsを組み合わせていろいろなエージェントを作るのにはまっています。 今回は StrandsAgents と Claude 4 のインターリーブ思考 を組み合わせ、マルチエージェントなし で Deep Research 相当の調査レポートを生成する手法を紹介します。 1. はじめに 1.1. DeepResearchについて 1.2. StrandsAgentsとは インターリーブ思考とは 2. 実装 2.1. エージェント 2.2. モデル(インターリーブ思考を有効にする) ポイント 2.…
6ヶ月前

ACL2025@ウィーンに現地参加しました
Taste of Tech Topics
こんにちは。ウィーンから日本に帰ってきたら暑すぎて体が追い付かないSsk1029Takashiです。今回は2025/7/27~8/1にウィーンで開催されているACL2025(The 63rd Annual Meeting of the Association for Computational Linguistics)に現地参加したので、その参加報告記事になります。 聴講参加でしたが、NLPの最先端を追えた素晴らしい機会でした。 (私は日程の都合で7/31までの参加でした。) ACLとは? 学会の様子 特に気になったセッション、論文 Tutorial: Uncertainty Quantifi…
7ヶ月前

Amazon S3 Vectors によるRAGの性能/精度を評価してみた
Taste of Tech Topics
はじめに こんにちは。データ分析エンジニアの木介です。 今回は、AWS Summit 2025 New Yorkにて発表されたS3 Vectorsについて、既存のベクトルストレージとの比較も含めて紹介していきたいと思います。 aws.amazon.com はじめに S3 Vectorsとは 1. 他ベクトルストレージとのコスト面での比較 2. 機能面での制限事項 3. S3 Vectorsのベストプラクティス 他ベクトルストレージとの速度面での比較 他ベクトルストレージとの精度面での比較 1. ベクトル検索による精度比較 2. ハイブリッド検索との精度比較 まとめ S3 Vectorsとは A…
7ヶ月前

DifyのReActを用いてナレッジ/記事要約エージェントを作ってみた
Taste of Tech Topics
皆さんこんにちは。バックエンドエンジニアの前田です。 最近は、いよいよ暑さが本気を出してきたので、熱中症対策をしなくては、と考えています。さて、今回はDifyのv1.0.0で追加されたReActを用いてナレッジ/記事要約エージェントを作成しました。 ナレッジに登録したドキュメントなどをもとに、Web検索もして情報を補足し、文章を要約するエージェントが欲しいと思い、作ってみました。Difyの環境構築と基本的な使い方については以下の記事を参考にしてみてください。 今回はDifyのv1.6.0を用いて作成しました。 acro-engineer.hatenablog.com 1. DifyにおけるRe…
7ヶ月前

Amazon Bedrock のプロンプトキャッシュはコスト/レイテンシーにどのような効果があるか?
Taste of Tech Topics
はじめに こんにちは、丸山です。LLMやナレッジベースの利用ができるサービス「Amazon Bedrock」の新機能として、2025/04/07に「プロンプトキャッシュ」が一般公開されました。 aws.amazon.com aws.amazon.com この機能により、LLM利用時のコスト削減とレイテンシー改善ができます。 今回は、プロンプトキャッシュを使用することで実際どの程度コスト削減やレイテンシー改善ができるのか試してみました。 はじめに プロンプトキャッシュのメリット プロンプトキャッシュの仕組み ざっと知りたい人向けの説明 詳しく知りたい人向けの説明 どのようなときに使うとよいか プ…
8ヶ月前

OpenSearch 3.0 でMCPによるAgentとの連携を行ってみる
Taste of Tech Topics
はじめに こんにちは。データ分析エンジニアの木介です。 今回は、OpenSearch 3.0の最新リリースについての紹介と、新たに対応したMCP(Model Context Protocol)を用い外部リソースとOpenSearchの連携方法について解説していきます。 opensearch.orgOpenSearchでのMCPの利用方法は、以下の2つの構成があります。構成①:OpenSearchからMCPを利用する OpenSearch内でMCPクライアント/サーバーを構築し、ユーザーからの検索内容に応じてMCP経由でリソースを利用する方法。 構成➁:MCPサーバーからOpenSearchを呼…
9ヶ月前

DifyワークフローでDeepResearchを実現する
Taste of Tech Topics
こんにちは、クラウドエンジニアの青山です。 最近、何か調べたいときには、通常の検索エンジンではなく、生成AIに聞くことが習慣になってきています。 調べたいことが分かりやすく得られるので、最近の生成AIの発展には、驚くばかりです。とはいえ、単純な検索ではなく、関係するような情報をいろいろ調べたりするのは、生成AIを使っても時間がかかりますよね。 そこで有用なのが、ユーザーの質問に対して、より広く深く考察しながら、回答をしてくれる「DeepResearch」だと思います。 いろいろな生成AIサービスで、この機能が登場してきていますが、今回この「DeepResearch」の機能を、Difyを使って実…
9ヶ月前

Cline × Amazon Bedrock でCRUDアプリのフルスタック開発をやってみた
Taste of Tech Topics
はじめに こんにちは一史です。 先日神代植物公園に行きました、まだ藤の花が残っておりとても綺麗で癒されました。昨今、開発支援のAIエージェントとしてClineが話題になっています。 github.comClineはVisual Studio Code(VSCode)の拡張機能であり、単なるコード生成だけでなく、コマンド実行や動作確認・デバッグまでを一貫して行ってくれる点が特徴です。Clineは任意の生成AIモデルを指定し、コードを生成させることができます。 このためセキュアで実際の開発現場でも活用されるAmazon Bedrockと組み合わせることでビジネスシーンでの活用も可能となります。 今…
10ヶ月前

Azure AI FoundryのServerless APIでPhi-4-miniを簡単にFine Tuningする
Taste of Tech Topics
こんにちは。データサイエンスチームYAMALEXの@Ssk1029Takashiです。 (YAMALEXについて詳細はこちらをぜひご覧下さい。) www.acroquest.co.jpつい先日Phi-4-reasoningというモデルがMicrosoftから発表されました。 軽量な事前学習済み言語モデル(SLM)も性能が上がってきて利用されることが増えてきています。 SLM は量子化などを施すことで、ハイエンド GPU を使わずとも動かせる点が利点です。 そのため、外に出せないデータを扱ったり、通信できない環境で利用されることが多いとされています。SLMを扱う場合に必要になるのはFine Tu…
10ヶ月前

Amazon Bedrock Knowledge Basesでカスタムデータソース+直接取り込みAPIを利用する
Taste of Tech Topics
こんにちは。大塚です。AIの進化スピードに驚かされる毎日です。 生成AIだけでなく、データ活用の仕組みもどんどん進化していますね。今回は、昨年12月にサポートされたBedrock Knowledge Basesのカスタムデータソースとドキュメントの直接取り込みAPIを試してみたいと思います!aws.amazon.com 1. はじめに 2. カスタムデータソース+直接取り込みAPIの概要とメリット カスタムコネクタとは? ドキュメントの直接取り込みとは? 3. 実際に試してみる 事前準備(ナレッジベースの作成) AWSマネジメントコンソールからドキュメントを投入 APIからドキュメントを投入 …
10ヶ月前

AWS Documentation MCP Server でAWSのFAQアシスタントを作成する
Taste of Tech Topics
はじめに データ分析エンジニアの木介です。 AWSの公式ドキュメントで欲しい情報を探そうとしても、なかなか目的のページが見つからなかったりすることってありませんか? AWSから「AWS Documentation MCP Server」が公開されたため、本記事では、それを利用して、最新のAWSドキュメントに基づき、質問に回答してくれるFAQアシスタントの作成方法について紹介したいと思います。MCP Serverの呼び出しには、Claude Desktop および dolphin-mcp を利用します。github.com はじめに 概要 1. MCPとは MCPのしくみ 2. AWS Docu…
10ヶ月前

Azure MCP ServerとGitHub CopilotでAzure上のアプリをできる限り簡単に作る
Taste of Tech Topics
こんにちは。データサイエンスチームYAMALEXの@Ssk1029Takashiです。 (YAMALEXについて詳細はこちらをぜひご覧下さい。) www.acroquest.co.jpMCP(Model Context Protocol)が登場して少し時間が経ちましたが、その間にMCPに対応するサービスが増え、LLM 用ツールとしてその利用も拡大しています。 ツール提供側・クライアント側のどちらのサービスも増えており、今後さらに対応が広がりそうです。そのような中で、MicrosoftがAzure MCP ServerというAzureリソースをMCP経由で操作できるMCP Serverを公開しま…
10ヶ月前