Ridge-institute R&D Blog

https://iblog.ridge-i.com/

株式会社Ridge-i R&Dチームのテックブログです.

フィード

記事のアイキャッチ画像
Multimodal RAG experiments with LlamaIndex and Qdrant
Ridge-institute R&D Blog
Hello! This is Aurélie, an Artificial Intelligence Engineer at Ridge-i. In this blog post, I'll be sharing insights from a small trial where I experimented with LlamaIndex [1] and Qdrant [2] to build a multimodal Retrieval-Augmented Generation (multimodal RAG) system. Introduction Case study design …
11日前
記事のアイキャッチ画像
INTERSPEECH2024から見る音声認識研究の動向
Ridge-institute R&D Blog
はじめに INTERSPEECH 2024から見る音声認識研究の動向 複数話者の音声認識 複数言語の音声認識 デコーディング処理 文脈バイアス 表現学習 その他トピック まとめ 参考文献 はじめに 前回の記事では音声認識の基本と代表的な大規模学習済みモデルを紹介させていただきました。 音声認識や音声合成はさまざまなアプリケーションで目にする機会が増えました。一方で、現在の技術でもまだまだ課題はあります。 本稿は近年の研究モチベーションを代表的なタスクである音声認識をベースに紹介させていただきたいと思います。 INTERSPEECH 2024から見る音声認識研究の動向 本稿は、音声認識を扱う国際…
19日前
記事のアイキャッチ画像
音声認識のための大規模学習済みモデルについて
Ridge-institute R&D Blog
はじめに 音声認識の基本的な仕組み CTC損失ベースの手法 RNN Transducer (RNN-t) Attentionベースの手法 音声に関する大規模学習済みモデル Wav2vec 2.0 HuBERT XLS-R WavLM Whisper まとめ 参考文献 はじめに AIとの関連性が高いタスクの1つに音声認識があります。 音声認識は音声が入力されたときに話されている内容をテキストとして書き起こすタスクです。 AIサービスで音声データを活用する際に、前処理としての利用が期待されます。 本稿は音声関連のAI技術に興味を持っていただくことを目的に、代表的なタスクである音声認識を取り上げ、 …
1ヶ月前
記事のアイキャッチ画像
ScalarDB Clusterを利用して複数のDBにアクセスするアプリケーションをAmazon Elastic Kubernetes Service (Amazon EKS) 上にデプロイ
Ridge-institute R&D Blog
はじめに ScalarDB Clusterとは ScalarDB Coreライブラリとの違い ScalarDB Clusterを導入するメリットと活用シチュエーション 2つのアクセス方式 Indirect Client Mode direct-kubernetes client mode 構築・デプロイ 1. 前提条件 2. 作業環境セットアップ 2.1 AWS CLIのインストール・認証設定 2.2 kubectl のインストール 2.3 eksctl のインストール 3. EKS クラスタのセットアップ 3.1 EKS クラスタの作成 3.2 kubectl の設定 3.3 EKSクラスタ…
2ヶ月前
記事のアイキャッチ画像
Flow-Guided Transformer for Video Inpainting (FGT++) Explained
Ridge-institute R&D Blog
Introduction to Video Inpainting Problem Definition Drawbacks in the Problem Formulation Common Challenges Categories of Existing Models Explanation of Optical Flow Paper Explanation FGT++ 2021 SOTA Model E2FGVI FGT++ vs. E2FGVI Comparison Summary Architecture Improvement Improved Optical Flow Estim…
2ヶ月前
記事のアイキャッチ画像
データ分散の課題を解決する「ScalarDB」のクイックスタートを試して使用感をレビュー
Ridge-institute R&D Blog
はじめに ScalarDBとは? ScalarDB導入のメリット 1. 接続方式が異なるDBに統合的にアクセスが可能 2. データベース間でのデータ整合性をシンプルな実装で担保可能 活用事例 1.ScalarDB を用いた 検索拡張生成(RAG)/ 大規模言語モデル(LLM)構築 2. 低コストでの顧客情報の統合 3.老朽化システムの費用削減 実装方法 クイックスタートの実施 1. 環境の準備 2. ScalarDBサンプルリポジトリのクローン 3. データベースの準備 4. アプリケーションの起動 5. 実装の説明 6. 2フェーズコミットを実装 実際に触ってみた所感 おわりに 引用文献 参…
3ヶ月前
記事のアイキャッチ画像
A general overview of multimodal RAG
Ridge-institute R&D Blog
Hello, this is Aurélie, working as an Artificial Intelligence Engineer at Ridge-i. Today I would like to share an introduction to multimodal Retrieval-Augmented Generation (multimodal RAG) systems as part of a survey we conducted internally at Ridge-i. Introduction Motivation When to use RAG Basic R…
4ヶ月前
記事のアイキャッチ画像
Introduction of the color spaces and color augmentation techniques
Ridge-institute R&D Blog
Hello, I'm Nguyen Trung Kien, an AI engineer at Ridge-i. Today, I would like to share information about color spaces for color augmentation techniques. Additionally, I will demonstrate the color augmentation techniques based on the basic color space as well as some advanced ones. Introduction Color …
5ヶ月前
記事のアイキャッチ画像
LLMのローカル環境構築を簡単にするNIMの使用感をレビュー
Ridge-institute R&D Blog
はじめに 今年NVIDIA NIMが発表され、すでに海外の様々な企業が生成AIの基盤として採用しているなど盛り上がりを見せています。 弊社にもローカルでLLMを構築したいというニーズをいただくことが多いため、今回NVIDIA NIMを試し、NIMでどういったことができるのかや、スクラッチで開発する時と比べてどのような恩恵を受けられるのかをNvidiaが提供しているサンプルプロジェクトをもとに試してみました。 2024年6月に公開された新規のサービスのため、2024年10月時点では、公式以外の関連情報、実際に試してみた系記事などはこれから増えてくるタイミングかと思います。 本記事を通じて、この技…
6ヶ月前
記事のアイキャッチ画像
衛星解析ツール「Ridge SAT Image Analyzer」の技術スタックについて
Ridge-institute R&D Blog
はじめに 衛星画像解析の課題 技術的な課題 運用上の課題 Ridge-iが開発した衛星AIソリューション:RSIA RSIAの活用例 RSIAの技術的特徴 今後の展望 最後に 過去の参考記事 はじめに こんにちは!Ridge-iの AI エンジニアのwhataです。 今回は、私たちが開発し、改良を重ねている衛星解析ツール、Ridge SAT Image Analyzer(RSIA)についてご紹介します。 衛星解析やその他AIに興味がある方、下記のリンクからエントリーが可能です。 www.wantedly.com 衛星画像解析の課題 衛星画像の解析は、都市計画、農業、環境モニタリングなど、多くの…
8ヶ月前
記事のアイキャッチ画像
A Crash Course on LangChain for LLM Applications Development
Ridge-institute R&D Blog
Hello, I’m Sarah Yukie Soeda, an AI Engineer at Ridge-i. Recently, I have been studying about LLM application development using LangChain. In this article, I would like to share the some of the capabilities of LangChain. I hope this would be helpful to anyone who would like to dive into the world La…
1年前
記事のアイキャッチ画像
Using diffusion models to generate synthetic data for real-life projects
Ridge-institute R&D Blog
Hello, this is Aurélie, working as an Artificial Intelligence Engineer at Ridge-i. Today, I would like to introduce a way to use synthetic data generated with diffusion models to improve the performance of our models even when working with difficult data (low amount of data, unusual data) ! Disclaim…
1年前
記事のアイキャッチ画像
ML data annotation workflow with CVAT, FiftyOne, and DVC
Ridge-institute R&D Blog
Hello. My name is Jonathan, an artificial intelligence engineer at Ridge-i inc. As do many AI engineers, I enjoy designing and training ML (machine learning) models, and experimenting with various models and architectures. However, one of the most important parts of any successful ML project is crea…
2年前
記事のアイキャッチ画像
量子アニーリングを用いた最適化問題の定式化方法について
Ridge-institute R&D Blog
はじめに こんにちは,株式会社Ridge-iエンジニアの中村です.本記事では量子アニーリング手法を用いた最適化についてご紹介します. 量子アニーリングでは,イジングモデルという統計力学の理論モデルを用いて最適化計算を行うため,通常の数理モデルの定式化からQUBOと呼ばれる式へ変換する必要があります.私自身QUBOについてはあまり知らなかったため,これを機に調べてみました.またスケジュールタスクに量子アニーリングを適用した論文 "Applying Quantum Annealing for Shift Scheduling Problem for Call Centers" の問題設定を模擬して…
2年前
記事のアイキャッチ画像
Methods for finetuning Stable Diffusion model
Ridge-institute R&D Blog
Hello, I am Bu Hongyu, working as an Artificial Intelligence Engineer at Ridge-i Inc. In this article, I will show you how to quickly finetune Stable Diffusion (SD) model with just a few training images (5-10 images) and generate images in your own style. Introduction to SD model SD model is a machi…
2年前
記事のアイキャッチ画像
ChatGPTを業務へ活用するには?活用方法のご紹介
Ridge-institute R&D Blog
Ridge-iの中野です。今回は、日本でも大きく話題になっているChatGPTの活用方法についてご紹介します。 ChatGPTとは ChatGPTとは昨年11月にOpenAI社からリリースされたチャットボットであり、幅広い分野の質問に対して詳細な回答を生成できることで注目を集めています。高度な質問に答えたり、新しい企画案を自動生成することができるため、多くの業界においてChatGPTの活用に向けた議論が始まっています。 チャットボットの分類とChatGPT チャットボットは、大別して「古典的なシナリオ型チャットボット」と「AI型チャットボット」の2種類があります。古典的なシナリオ型チャットボッ…
2年前
記事のアイキャッチ画像
無料で衛星データを取得する方法について
Ridge-institute R&D Blog
Ridge-iのエンジニアのwhataです。 今回は無料で世界中の「今」を知れる衛星データ取得方法について解説します。 はじめに 近年衛星の打ち上げ数が増えており、それに伴い、衛星データの利用が拡大しております。 例えば、[1]では、農業、森林伐採、漁業や株価予測まで様々なところで衛星データが利用されていると書かれております。 一方で、どのように取得すればよいかわからない。衛星データは高価であるためなかなか手が出しにくいといった声も聞かれます。そこで、今回は無料で手に入れることができる衛星Sentinelの取得方法についてまとめたいと思います。 この記事では、衛星データで簡単に確認できればよい…
2年前
記事のアイキャッチ画像
Machine-Learning denoising for Pixar movies
Ridge-institute R&D Blog
Did you know that denoising is the only technology from Disney Research that gets special thanks in the credits of Frozen II ? Denoising technology has been used in every single Pixar movies ever since Toy Story 4 (2019). In this article, I'd like to share how Pixar is currently using deep-learning …
2年前
記事のアイキャッチ画像
Logging: Make it standardized and centralized with FluentD
Ridge-institute R&D Blog
Hi, I'm Nathalie, an AI Engineer at Ridge-i Inc. For this post, I will briefly introduce FluentD as a tool for logging with docker, and why it's important to keep logging simple to easily scale when working with containers. Introduction Standardized logging Centralized logging Demo with FluentD Intr…
2年前
記事のアイキャッチ画像
Noise as a regularizer, resilience measure, and embedding generator
Ridge-institute R&D Blog
Hi! This is Ridge-institute and in today's article, Motaz Sabri will share with us his explorations on the person reidentification (ReID) model's ability to generalize across datasets and their distortion robustness. Person ReID is frequently utilized in security and surveillance services. Many curr…
2年前
記事のアイキャッチ画像
アジャイル開発における設計の研究
Ridge-institute R&D Blog
unsplash@david-travis はじめに アジャイル開発の必要性 アジャイル開発における12の原則 納品の成果物 設計の必要性をまとめ アジャイル開発における設計の手探り アジャイル開発における設計のやり方 最低限設計すべき資料のカテゴリ👇 設計のツール及び注意事項 おわりに 参考文献 こんにちは,Ridge-iの王です。 本記事では筆者の今までSEとして11年システムに関わる設計や開発の経験とRidge-iに入社半年の間、アジャイル開発の業務経験を通じて、アジャイル開発における設計の必要性、手法のノウハウ、設計の粒度や課題について、感じていたことを共有したいと思います。 はじめに…
3年前
記事のアイキャッチ画像
Data Version Control (DVC): Beginner's Guide
Ridge-institute R&D Blog
Hello everyone, I am Ajmain Inqiad Alam, working as an Artificial Intelligence Engineer at Ridge-i Inc. In this article, I will introduce the Data Version Control (DVC) tool. What is Data Version Control (DVC)? Use case of DVC DVC comparison with other tools Installation of DVC Example on how to use…
3年前
記事のアイキャッチ画像
NeRFのレンダリング表現を3D情報として得る方法
Ridge-institute R&D Blog
こんにちは,Ridge-iの関口です.本記事ではNeural Radiance Fields (NeRF) [1]の技術で場を学習したネットワークから3D情報を取得する方法についてご紹介したいと思います.といっても著者らのオリジナル研究のプロジェクトページ上にあるスクリプトの解説に近いのですが,ウェブ上にあまり情報がなかったので書き記しておきたいと思います. NeRFは任意視点の画像をレンダリングできますが,あくまで2Dとしての見え方を推定しているものです(正確に言えば,NNに対して座標とその座標を覗き込む角度を入力として,そのときの点の色と密度を推定する作業を繰り返して表面座標の情報を得る,…
3年前
記事のアイキャッチ画像
RIdge-iのパートタイムエンジニアについて
Ridge-institute R&D Blog
こんにちは、株式会社Ridge-i エンジニアの岡本です。今回の記事は今までとは少し異なり、私がパートタイムエンジニアの頃に行ったタスクの紹介を通じて、Ridge-iのパートタイムエンジニアの業務内容や、学べることについて知っていただけたらと思います。 お断りとして、以降の内容は私がパートタイムエンジニアだった頃(2019/11 ~ 2022/3)の話であることおよび、業務内容は年々更新されていることはご承知ください。 はじめに 弊社では、現在パートタイムエンジニアを募集しております。同職種の業務内容は以下になります。 ・クライアントが抱える課題に対して、エンジニアとして統計的・機械学習的手法…
3年前
記事のアイキャッチ画像
Image2Point: 3D Point-Cloud Understanding with Pretrained 2D ConvNets
Ridge-institute R&D Blog
こんにちは,Ridge-iの@obaradsです.本記事では,Image2Point: 3D Point-Cloud Understanding with Pretrained 2D ConvNets [Xu et al, 2021]を紹介します(こちらの論文ではNeural Collapseについても取り扱っていますが,長くなるため今回は省きます). arxiv.org はじめに ロボティクスや自動運転などの分野では,点群と呼ばれるデータが扱われることがあります.点群は,LiDARをはじめとする深度センサーから取得することが可能であり,取得された点群は3Dマップやセグメンテーションなどに利用…
3年前
記事のアイキャッチ画像
Optimizing calculation speed of matrix inner products
Ridge-institute R&D Blog
Introduction Hi! This is Mark Bajo and I am here to share an algorithm for fast multiplication of square matrices. Implementing fast and efficient algorithms is one of the many skills a computer scientist is expected to have. In machine learning and/or deep learning, we deal with large matrices and …
3年前
記事のアイキャッチ画像
画像に対する教師なし異常検知
Ridge-institute R&D Blog
こんにちは,株式会社Ridge-iの竹本です.本記事では画像を用いた教師なし異常検知タスクとその手法を紹介します. TL;DR 教師なし異常検知タスクとは データセット 手法の紹介 Deep Nearest Neighbor Anomaly Detection SPADE: Semantic Pyramid Anomaly Detection PaDiM: a Patch Distribution Modeling Framework for Anomaly Detection and Localization PatchCore: Towards Total Recall in Indust…
3年前
記事のアイキャッチ画像
SCSNet: An Efficient Paradigm for Learning Simultaneously Image Colorization and Super-Resolution
Ridge-institute R&D Blog
こんにちは, 株式会社Ridge-iエンジニアの辻埜です. 本記事では, グレースケール画像のカラー化と低解像度画像の超解像化を同時に行う手法を提案した以下の論文をご紹介します. aaai-2022.virtualchair.net はじめに カラー化 超解像化 アプローチ PVCAttesntion Continuous Pixel Mapping 精度検証 データセット 評価指標 実験結果 まとめ さいごに 参考文献 はじめに 先日社内のslackで, 画像のカラー化の最新手法に関する話が話題に上りました. 画像のカラー化については私自身興味がありつつもプロジェクトで使用したことはなく情報…
3年前
記事のアイキャッチ画像
点群の特徴量としての画像
Ridge-institute R&D Blog
こんにちは, Ridge-iの@hide24563630 です. 本記事では, 画像から得られる情報を点群の処理に活用する研究を追試した結果を紹介します. また, 本記事はtancoro3にレビューしていただきました. はじめに 点群の特徴量の増やし方 実験 データセット 物体検出タスクにおける有効性の検証 セマンティックセグメンテーションタスクにおける有効性の検証 まとめ さいごに 参考文献 はじめに 3次元の物体認識やセグメンテーションは, 自動運転における周辺認識[1]や, スマートシティ計画・管理に必要不可欠である大規模都市3次元モデリング[2, 3]など, 幅広い分野で実用化が求めら…
3年前
記事のアイキャッチ画像
オッカムの剃刀と汎化誤差解析
Ridge-institute R&D Blog
こんにちは,株式会社Ridge-iリサーチチームの@machinery81です. 今回は有名なオッカムの剃刀の概念と,この原則に基づいた汎化誤差解析の最もシンプルな例を紹介したいと思います. 本記事の内容は以下のスライドに基づいています: speakerdeck.com TL;DR オッカムの剃刀 Occam Bound Occam Boundの証明 Occam Boundのベイズ的解釈 さいごに 参考文献 TL;DR オッカムの剃刀の概念について説明; オッカムの剃刀の形式化と汎化誤差解析への応用について説明. オッカムの剃刀 必要が無いなら多くのものを定立してはならない.少数の論理でよい場…
4年前