CCCMKホールディングス TECH LABの Tech Blog
https://techblog.cccmkhd.co.jp/
TECH LABのエンジニアが技術情報を発信しています
フィード

SnowflakeのAIで作るドキュメント管理システム
CCCMKホールディングス TECH LABの Tech Blog
こんにちは、CCCMKホールディングスAIエンジニアの三浦です。 私たちの部門では毎週LT会を開催していて、各自が持ち回りで資料を作って発表をしています。私も発表しているのですが、数年続いていることもあり、かなりの量の発表資料になってきました。これらの資料はとりあえず社内のストレージ内に保管しているのですが、せっかくならこれまで自身が築いてきた知見をもっと活用できるような形にしたいな、と考えるようになりました。 たとえば「LLMのFine-Tuningのやり方ってどこに書いてある?」とか、「画像解析についてこれまでどれくらい発表したっけ?」なんていう問い合わせに答えることが出来る仕組みです。 …
2日前

非構造化データを構造化する処理をSnowflakeのAI_EXTRACT関数で実装してみました。
CCCMKホールディングス TECH LABの Tech Blog
こんにちは、CCCMKホールディングスAIエンジニアの三浦です。 9月下旬になり、朝晩は少しずつ涼しさを感じるようになりました。私は四季の中で秋が好きなので、これからがとても楽しみです。 最近マニュアルや提案書といったドキュメントをAIで活用するため、どのようにそれらのデータを加工したらいいんだろう、ということを考えていました。 先日参加したSnowflakeのイベントでエンジニアの方々と情報交換させていただいた際にSnowflakeのAISQL関数"AI_EXTRACT"が使えるんじゃないか、といったアイデアをお聞きし、それ以来色々と試してみています。 そんな中、「このアプローチはいいかも」…
9日前

【メディア掲載】日本経済新聞で「AI増田宗昭」の記事が掲載されました
CCCMKホールディングス TECH LABの Tech Blog
テックラボが開発した「AI増田宗昭」の記事が日本経済新聞に掲載されました。 www.nikkei.com 「AI増田宗昭」は、こちらのCCC40周年サイトで公開中です。 www.ccc.co.jp
14日前

論文紹介 "iAgent: LLM Agent as a Shield between User and Recommender Systems"
CCCMKホールディングス TECH LABの Tech Blog
こんにちは。データサイエンスグループの木下です。 今回は、レコメンド×AIエージェントに関する論文である、 iAgent: LLM Agent as a Shield between User and Recommender Systemsという論文を紹介したいと思います。 1.Instruction 背景と課題 現在の推薦システムは「ユーザー-プラットフォーム」型であり、以下の問題が存在している プラットフォームが商業的目的を過度に追求した結果、ユーザーの真の関心から逸脱してしまう可能性がある マタイ効果(強者がより強くなる現象)により、発言力の弱いユーザーが無視されがちである エコーチェン…
16日前

Streamlit in SnowflakeとAI_EXTRACT関数を使ってブログの内容を管理する仕組みを作ってみました。
CCCMKホールディングス TECH LABの Tech Blog
Snowflake World Tour Tokyoに参加しました! AISQLによるドキュメントの構造化 Streamlit in SnowflakeによるUIの実装 とりあえず作ってみたもの AI_EXTRACT Streamlit in Snowflakeによるアプリ実装 課題 まとめ Snowflake World Tour Tokyoに参加しました! こんにちは、CCCMKホールディングスAIエンジニアの三浦です。 9月11日~9月12日に開催されたSnowflakeの日本でのイベント"Snowflake World Tour Tokyo"に参加しました! Snowflake Wor…
18日前

LT会でのNotebookLMの動画活用
CCCMKホールディングス TECH LABの Tech Blog
こんにちは、テックラボの井上です。 テックラボでは毎週1回、メンバーが集まってLT会(Lightning Talk会)を開催しています。一昨年度からスタートしたこの取り組みも、気がつけば3年目に突入。1時間の枠を2名でシェアして、それぞれ30分ほどの発表を行うスタイルで運営しています。 おおよそ月1回のペースで自分の発表順が回ってくるのですが、自分に限って言うと、「次は何を話そう…」とネタ探しに頭を悩ませることが多いです。 ちなみにこれまで登場したテーマを振り返ると: 定番の技術系 - AI・機械学習 - プログラミング関係 - 統計分析 - ソフトウェア開発手法 ちょっと意外な分野 - 会計…
24日前

databricksでgpt-oss-20bのFine-Tuningをする。
CCCMKホールディングス TECH LABの Tech Blog
こんにちは、CCCMKホールディングスAIエンジニアの三浦です。 OpenAIがリリースしたオープンウェイトの言語モデルgpt-ossをカスタマイズ、つまりFine-Tuningするにはどうするんだろう?と最近調べていました。色々情報が見つかり、トライしてみた中で一番わかりやすかったのがOpenAIのCookbookで紹介されている方法でした。 cookbook.openai.com gpt-oss-20bはリーズニングモデルで回答の前にリーズニング(論理的な思考・推論の過程)が実行されます。gpt-oss-20bはデフォルトの状態だと入力が英語以外の言語であってもリーズニングは英語で実行され…
24日前

databricks Model Servingで画像生成モデルを動かしてみました。
CCCMKホールディングス TECH LABの Tech Blog
こんにちは、CCCMKホールディングス三浦です。 最近は色々な画像生成モデルが出てきています。その中にはHugging Faceで公開されているものもあります。そういったモデルを試すことが出来る環境が欲しいな、と考えていました。 このブログでも何度か紹介しているdatabricksのModel Servingでは、T4もしくはA100が搭載されたサーバを選択することが出来、それらを使うことで画像生成モデルをModel Servingで動かしてAPI経由で利用することも出来るのでは、と考え、今回実際に試してみようと思いました。 結果、狙い通りにModel Servingで画像生成モデル(stab…
1ヶ月前

CCC社内で運用中のチャットボットのご紹介
CCCMKホールディングス TECH LABの Tech Blog
CCCでは全社で利用される単機能のAIチャットボットと、 その他各種ドキュメント参照機能のついたRAG(Retrieval-Augmented Generation)機能を持った チャットボットを絶賛運用中です。
1ヶ月前

databricks Model Servingを使ってPDF・PPTXテキスト抽出APIを動かしてみる
CCCMKホールディングス TECH LABの Tech Blog
こんにちは、CCCMKホールディングスAIエンジニアの三浦です。 ファイルを読み込み、その内容について回答が出来るLLM Agentを作ることが時々あるのですが、毎度ファイル読み込み処理を作るのが面倒だな、と感じることがありました。PDFやPPTXファイルからテキストデータを抽出したいというニーズはLLM Agentに限らず色々なシーンで発生するので、WebAPIにして様々なアプリケーションから利用できるようにしてみようと考えました。 稼働する環境はdatabricksのModel Servingで構築しました。Model Servingを利用することで、databricksを利用できる環境さ…
1ヶ月前

databricksのModel ServingにカスタムAgentをデプロイする時の手順について。
CCCMKホールディングス TECH LABの Tech Blog
こんにちは、CCCMKホールディングスAIエンジニアの三浦です。 日中はとても暑いのですが、朝早い時間に外に出るとほんの少し涼しさを感じることがあります。8月も後半に入ったんだなぁと改めて思いました。 以前databricksのModel Servingを使ってRAG AgentをAPIで提供する方法についてご紹介しました。 techblog.cccmkhd.co.jp この時はdatabricksのPlaygroundで作ったAgentをModel Servingにデプロイしたのですが、最近LangGraphで独自に作ったAgentをModel Servingにデプロイする方法を調べていまし…
1ヶ月前

Jetson AGX Orin 32GBでgpt-oss-20bを動かしてみる。
CCCMKホールディングス TECH LABの Tech Blog
こんにちは、CCCMKホールディングス AIエンジニアの三浦です。 最近のAIに関する出来事で特に印象に残っていることがOpenAIによるオープンモデルgpt-ossのリリースです。OpenAIはWhisperやCLIPといったオープンなモデルをリリースしていますが、オープンソースの言語モデルのリリースはgpt-2以来です。 openai.com サイズは120bと20bが提供されており、特に20bは12GBのメモリがあれば動くと紹介されており、エッジコンピューティングでの利用が期待できます。 エッジコンピューティング、と聞くと、私はNvidiaのJetsonが思い浮かびます。Jetsonは…
2ヶ月前

Test-Time Scalingがタスクに与える悪影響について、論文を読んで調べてみました。
CCCMKホールディングス TECH LABの Tech Blog
こんにちは、CCCMKホールディングスAIエンジニアの三浦です。 先週末はたくさん花火大会が開催されたようで、私の住む街でも花火を見ることが出来ました。打ち上るたびに次はどんな花火になるんだろうと想像するのが楽しくて、いつまでも見ていられるなぁと思いました。 はじめに 今回読んだ論文 検証における比較対象 Test-Time Scalingによって精度が落ちるタスク Simple counting tasks with distractors(気を散らす情報を含む単純な数え上げ) Regression tasks with spurious features(目的変数に関係ない特徴量を含む回帰…
2ヶ月前

Github CopilotのAgent Modeを用いたVibe Codingによる機械学習モデルの構築
CCCMKホールディングス TECH LABの Tech Blog
こんにちは。データサイエンスGr.の木下です。 昨今、生成AIが急速に業務に浸透しています。 その中で、Vibe Codingという、自然言語のみでプログラミングをする技術が話題になっています。 Vibe Codingによるアプリケーション作成の事例は多々見受けられる一方、 データサイエンスの文脈で使用されている事例は見かけません。 そこで、SIGNATEの分析コンペを対象に、 Vibe Codingのみで(すなわち、コードを一切書かずに)どこまで精度が出るのか検証してみました。 Github Copilot Agent Mode 正式名称「Copilot Coding Agent」として、2…
2ヶ月前

SnowflakeのCortex AISQLを一通り使ってみました!
CCCMKホールディングス TECH LABの Tech Blog
こんにちは、CCCMKホールディングスAIエンジニアの三浦です。 先日サンフランシスコで開催されたSnowflakeの年次サミット"SNOWFLAKE SUMMIT25"のキーノートセッションの動画がアップされていて、最近そちらを閲覧しました。面白いアップデートが紹介されていたのですが、その中で特に印象に残ったのが"Cortex AISQL"です。 Cortex AISQLはSQLの中でLLMを呼び出し特定の処理を実行することが出来る関数セットです。LLMを使った特定の列の変換処理や、潜在的な意味に基づいたテーブルの結合処理を実現することが出来ます。 本記事では、現在利用できるAISQLを一通…
2ヶ月前

DSPyとMLflowで LLMアプリケーションを開発!
CCCMKホールディングス TECH LABの Tech Blog
こんにちは、CCCMKホールディングスAIエンジニアの三浦です。 先日、今年6月に開催されたdatabricksのDATA+AI Summit2025を振り返るdatabricksのユーザー会に参加し、LT枠で登壇させていただきました。 jedai.connpass.com 大分前からLLMアプリケーション開発フレームワーク"DSPy"をテーマにしてお話したい!と考えていました。DSPyは"Programming-not prompting-LMs"というメッセージを掲げた、AIアプリケーションの構築をプロンプトエンジニアリングに頼るのではなく、Moduleの組み合わせ (プログラミング) と…
2ヶ月前

MLflowのPrompt Registryを使ってみる!
CCCMKホールディングス TECH LABの Tech Blog
こんにちは、CCCMKホールディングスAIエンジニアの三浦です。 生成AI周りの機能がアップデートされたMLflowに、ベータ版の機能で"Prompt Registry"が搭載されていました。この機能はプロンプトエンジニアリングの効率化を目的とした機能で、生成AIアプリに搭載するプロンプトの編集、バージョン管理、タグ付け等を行うことが出来ます。Prompt Registryに登録されたプロンプトはコマンド一つでダウンロードすることが可能です。 今回の記事では、現在ベータ版であるPrompt Registryを触って調べてみたことをまとめたいと思います。おそらく今後様々なアップデートが行われ、現…
3ヶ月前

"Prompting"から"Programming"へ!DSPyを使ったLLM Agent開発。
CCCMKホールディングス TECH LABの Tech Blog
こんにちは、CCCCMKホールディングスAIエンジニアの三浦です。 毎日とても暑いですね・・・。体調を崩さないように気を付けないと、と思います。 databricksのDATA+AI Summit2025に参加したとき、ブレークアウトセッションで"DSPy"というAIアプリケーション開発フレームワークを取り扱っているものが結構あることに気づきました。 DSPyは以前このブログの中でも触れたことがあります。 techblog.cccmkhd.co.jp 投稿した日付を見ると、ちょうど一年前でした。今回久しぶりにDSPyを使ってみたのですが、当時よりも使いやすくなった印象を受けました。もちろんDS…
3ヶ月前

CCCグループのAI利活用〜AI倫理ポリシーと全社横断の推進体制〜
CCCMKホールディングス TECH LABの Tech Blog
こんにちは。テックラボの中岸です。 テックラボではAIの研究開発を行っていますが、その周辺情報として、今回のエントリーでは会社全体でのAI利活用の取り組みや体制についてご紹介します。 CCCグループ AI倫理ポリシーの策定 2025年1月、CCCグループはAIの利活用における基本的な考え方と行動指針を明文化した「AI倫理ポリシー」を公表しました。 このポリシーは、AIを活用するすべての社員が「人間中心」「透明性」「プライバシーの保護」「公平性」「安全性」といった価値観を共有し、責任あるAIの実装を進めるための基盤となるものです。 AI技術の進化とともに、企業としての倫理的な姿勢が問われる今、私…
3ヶ月前

LangGraph Supervisorを使ったMulti-Agentシステムの構築
CCCMKホールディングス TECH LABの Tech Blog
LangGraph Supervisorを使ったMulti-Agentシステムの構築
3ヶ月前

databricksのノーコードでAgentが作れる"Agent Bricks"を試してみました。
CCCMKホールディングス TECH LABの Tech Blog
こんにちは、CCCMKホールディングスAIエンジニアの三浦です。 先日参加したdatabricksのDATA+AI Summitというイベントでは様々なdatabricksの新しい機能が発表されました。 techblog.cccmkhd.co.jp その中で個人的にとても気になったのが"Agent Bricks"という機能です。 Agent BricksはプロダクトレベルのAI Agent開発をノーコードで実現することが出来るdatabricksの新しい機能です。現在一部のリージョンでbeta版で利用することが出来る状態です。私はAzure Databricksの"eastus"リージョンで試…
3ヶ月前

databricksのData+AI Summit2025に参加しました!
CCCMKホールディングス TECH LABの Tech Blog
こんにちは、CCCMKホールディングスAIエンジニアの三浦です。 先週一週間、アメリカのサンフランシスコに出張してきました!目的はdatabricksのData+AI Summitというイベントに参加をするためです。 今回の記事では現地の様子をいくつかご紹介をした後に、2日間に渡って行われたキーノートセッションで紹介されたdatabricksのアナウンスについてまとめていきます! Data + AI Summit 2025 現地の様子など 会場付近 キーノートセッション 街中の広告 会場で配布されていたご飯 キーノートセッションでの新機能の発表 Lakebase Databricks Apps…
4ヶ月前

DatabricksでVLM(Vision Language Model)の推論と評価を試してみました。
CCCMKホールディングス TECH LABの Tech Blog
こんにちは、CCCMKホールディングスAIエンジニアの三浦です。 今週、アメリカサンフランシスコで開催されるDatabricksのイベントに現地参加します。どんなアップデートが聞けるかとても楽しみです。 現地は気温が東京に比べて低めなので、風邪を引かないように気を付けようと思います。 はじめに 使用するVLM 評価用のデータ データセットをダウンロードしてUnity Catalogに登録する VLMで推論を行う LLM as a judgeによる推論結果の評価 まとめ はじめに 最近のAIツールはテキストだけでなく画像を入力したり生成したり出来ることが普通になってきました。それらのツールが具体…
4ヶ月前

第39回人工知能学会全国大会に参加しました!
CCCMKホールディングス TECH LABの Tech Blog
こんにちは、CCCMKホールディングスAIエンジニアの三浦です。 先日開催された人工知能学会全国大会に現地参加してきました!どんなイベントで、現地がどんな様子だったのか、そして特に印象に残ったトピックなどをまとめたいと思います。 第39回人工知能学会全国大会 人工知能学会全国大会は一般社団法人人工知能学会が主催する日本最大級のAI学術イベントで、今年2025年で39回目になります。 今年は5月27日~5月30日の期間で大阪の中之島にある大阪国際会議場(グランキューブ大阪)で開催されました。現地開催だけでなくオンラインでも配信され、参加者は最終的に4,902人となったそうです(現地参加が約4,0…
4ヶ月前

Dockerで作ったコンテナアプリをSnowflakeで動かしてみる!~Snowpark Container Services~
CCCMKホールディングス TECH LABの Tech Blog
こんにちは、CCCMKホールディングスAIエンジニアの三浦です。最近オフィスが変わり、電車に乗っている時間が長くなりました。「読まないと」と思ってため込んでいた論文や記事を集中して読んでいく時間として活用しています。 最近Snowflakeでコンテナアプリを動かすことが出来る、という話を知り、どんな感じなのか試してみたいと思いました。利用するのは"Snowpark Container Services"というSnowflakeのフルマネージドコンテナサービスで、今回は開発環境でDockerで作っていたコンテナアプリをこの機能を使ってSnowflakeで動かしてみる、という話をご紹介していきます…
4ヶ月前

Azure Load Testingによるチャットボットの負荷テストを試してみました
CCCMKホールディングス TECH LABの Tech Blog
こんにちは、AIエンジニアリンググループの矢澤です。 世間はGWでしたが、毎年この時期は交通機関や観光地が混むイメージがあるので、私はほぼ自宅で過ごしました。 ただ、イベントへの参加は新たなインスピレーションなど業務に繋がる可能性もあるので、別の時期に出掛けられればと思っています。 近年、生成AIによるチャットボットが広く普及してきたと感じています。 これまで生成AIについては、社内向けのチャットボットなど一部の業務や機能において検証・導入を進めてきました。 今後は、より具体的なユースケースに向けた活用や量産化も視野に入れていく予定です。 ボットなどのAIサービスを社外に向けて活用していくこと…
4ヶ月前

Snowflake Cortex Searchでセマンティック検索!
CCCMKホールディングス TECH LABの Tech Blog
こんにちは、CCCMKホールディングス AIエンジニアの三浦です。気温が急に高くなって、まるで夏が来たみたいです。朝と夜はまだ涼しいので、出かける時に何を着ていくのか悩んでしまいます。 Cortex Search コードの実行環境と検証に使用したデータ ライブラリのインストール 翻訳処理の事前準備 データセットのダウンロードとサンプリング 翻訳処理の実行 SnowflakeのTableに書き込む Cortex Searchを作成する Cortex Searchにクエリを実行する まとめ Cortex Search Cortex SearchはSnowflakeのセマンティック検索を実現するため…
4ヶ月前

LLMに潜在空間で思考させる"Chain of Continuous Thought"についての論文を読みました。
CCCMKホールディングス TECH LABの Tech Blog
こんにちは、CCCMKホールディングス AIエンジニアの三浦です。 先日海に行きました。景色もそうですが、海の近くでは普段の生活であまり感じない匂いなんかも感じられて新鮮な気持ちになりました。 はじめに LLMの推論精度を向上させる方法に"CoT(Chain of Thought)"があります。これはLLMにすぐに回答を生成させるのではなく回答に必要になる思考のプロセスを生成し回答させることで、論理的な思考が必要になる問題にも対処出来るようにするテクニックです。 たとえば AならばB, BならばC, DならばE, CならばF が成り立つとき、AならばFは成立する? といった問題を考えてみます。…
5ヶ月前

Snowflake Cortex AnalystとLangGraphでテーブルデータ分析Agentを作る。
CCCMKホールディングス TECH LABの Tech Blog
こんにちは、CCCMKホールディングス AIエンジニアの三浦です。 最近はだいぶ暖かくなって、新緑がまぶしい季節になりました。外に出るのが気持ちのいい時期は一年の中で意外と限られているので、しっかりと堪能したいです。 さて前回SnowflakeのCortex Analystという機能を使って自然言語でTableに問い合わせ、データを取得する、という流れを試してみました。 techblog.cccmkhd.co.jp 前回はSnowflakeのWeb UI(Snowsight)上で動作を確認したのですが、やはり外部のアプリケーションからCortex Analystを使えると色々とやれることが広が…
5ヶ月前

SnowflakeのCortex Analystを使ってみました
CCCMKホールディングス TECH LABの Tech Blog
はじめに Cortex Analyst Semantic Model Dimensions Time Dimensions Facts Filters Metrics Cortex Analystを構築してみる Snowflakeへのデータの格納 Semantic Modelの構築 つまずいたポイント まとめ はじめに こんにちは、CCCMKホールディングス AIエンジニアの三浦です。 最近クラウドデータプラットフォーム"Snowflake"を色々と調べています。Snowflakeに含まれるLarge Language Model(LLM)を利用した"Snowflake Cortex"という機…
5ヶ月前