Morpho Tech Blogのフィード｜企業テックブログRSS

Morpho Tech Blog

https://techblog.morphoinc.com/

株式会社モルフォが提供する技術ブログです。画像処理・AIに関する情報をお届けします。

フィード

A Brief Survey of Schrödinger Bridge (Part I)

Morpho Tech Blog

こんにちは、CTO室リサーチャーの長山と申します。モルフォでは毎週金曜日に持ち回りで論文紹介等を行うJournal Clubという取り組みを行っています。今回は、私がその場で発表したSchrödinger Bridge（シュレーディンガー橋; SB）という確率論的生成モデルスキームの解説スライドを公開いたします。 Stable DiffusionやMidjourneyに代表されるような画像生成AI手法は、ここ一年間で目覚ましい発展を遂げたことは記憶に新しいと思います。その原動力となった基礎技術の一つが拡散モデル（Diffusion Models）です。拡散モデルとは、データからノイズへ…

8ヶ月前

OJT 2023: ジェスチャー認識とRealSenseを活用したARアプリ

Morpho Tech Blog

こんにちは。23年度入社のリサーチャーの三冨です。入社後2か月間にわたったグループ研修の内容と結果について報告します。テーマは「深度情報を利用したアプリケーション」です。はじめに私たちはECサイトで用いられる商品紹介のためのARアプリを題材として研修を行いました。このようなアプリの例として家具の配置をシミュレートするARアプリが挙げられます。カメラ映像に3Dモデルをリアルタイムに重ねて表示できるものです。部屋を映せば家具のコーディネートが購入前に確認できます。このようなアプリに、3Dハンドジェスチャー認識機能を搭載して機能拡張することを考えました。通常の2Dジェスチャー認識に加えてカ…

9ヶ月前

JDLA主催「CVPR2023技術報告会」発表資料

Morpho Tech Blog

先日、日本ディープラーニング協会主催（JDLA）の「CVPR2023技術報告会」にてモルフォの技術者が登壇いたしました。 www.morphoinc.com CVPRという国際学会の重要性や、今年のトレンドの分析、モルフォの技術者が注目した分野や論文について紹介しました。資料を見たいという声を多数いただいたので発表資料を共有させていただきます。 JDLA主催「CVPR2023技術報告会」発表資料 fromMorpho, Inc. 発表動画については以下のリンクから是非ご視聴ください。 https://www.youtube.com/watch?v=XVgUvFig-_M

9ヶ月前

Contrastive Learningの最新動向のレビュー

Morpho Tech Blog

こんにちは。CTO室リサーチャーの鈴木です。今回は、深層学習の分野でここ数年盛り上がっているContrastive Learning系の手法について、主だった論文を系統的にまとめて紹介したいと思います。はじめに近年発展した自己教師あり学習（Self-Supervised Learning：SSL）は、アノテーション情報を人の手ではなく機械的に付与することで、データセットの構築にかかる時間やコストを軽減し、深層学習モデルの精度向上を目指した手法です。自然言語処理分野におけるSSLは大きな成功を収め、ChatGPT等の超高性能なチャットボットの出現にも影響を与えました。 SSLは主に深層学習モ…

1年前

実務訓練 2022：ネイル画像生成アプリケーションの作成

Morpho Tech Blog

本記事は、2022年度の実務訓練で勤務した高橋快斗さんによる寄稿です。はじめにはじめまして。2023年の1月から2月にかけて株式会社モルフォで実務訓練を行っていた豊橋技術科学大学の高橋です。本実務訓練では、昨今話題のText-to-Image技術を応用したネイル画像生成アプリケーションを作成しました。このアプリケーションでは、ユーザーがネイルデザインを指定することで、自動的に画像を生成することができます。生成画像早速ですが、生成されたネイル画像は図1になります。図1 生成画像例

1年前

インターンシップ 2022：手と物体のInteractionを検出するWebアプリの開発

Morpho Tech Blog

はじめまして。2022年夏季に株式会社モルフォでインターンをしていた山本です。現在は情報系の大学院でVision-Languageに関する研究を行っています。私のインターンシップでは、画像中の手と物体を検出し、それらの状態を文として出力するWebアプリケーションの開発に取り組みました。

1年前

OJT 2022：depth mapを用いた画像のレイヤー分割＋エフェクト

Morpho Tech Blog

こんにちは。プロダクト開発部の中屋敷です。当社では毎年、新入社員でグループ研修を行います。今年度、私達が研修で作成したのが「画像のレイヤー分割」と「水彩画効果を用いた動画化」システムです。本記事では、このシステムの開発の目的や原理、実現したことについてご紹介いたします。概要皆さんはデジタルで絵を書いたことはありますか？デジタルではアナログと違い、元に戻したりコピーしたりと便利な機能がありますが、その中でも特に重要なのがレイヤー機能です。風景・人・犬といった描写物を別々の透明フィルムに書き込み、それらを重ね合わせることで一枚の絵とするものです。このレイヤー機能により、人のポーズを変えたり位置…

2年前

HiPPO/S4解説

Morpho Tech Blog

こんにちは、CTO室リサーチャーの角田です。社内では毎週金曜日に持ち回りで論文紹介を行うjournal clubという活動を行っております。そちらで私が発表した以下３本の論文 HiPPO: Recurrent Memory with Optimal Polynomial Projections (NeurIPS 2020 Spotlight) Combining Recurrent, Convolutional, and Continuous-time Models with the Linear State Space Layer (NeurIPS 2021) Efficiently Mo…

2年前

CVPR 2021 参加報告

Morpho Tech Blog

こんにちは、2021年4月に入社したCTO室リサーチャーの名古屋です。私たちが働く株式会社モルフォでは毎年、国内外を問わず画像処理・機械学習の学会や国際会議に積極的に参加しています。今回は私ともう2名の社内リサーチャーとで、6月19～25日に開催した「CVPR 2021」に参加してきました。この記事では、CVPRの概要と、個人的に気になった研究を3つピックアップして紹介します。

2年前

インターンシップ 2021：エッジを用いた Inpainting

Morpho Tech Blog

本記事は、2021年のインターンシップで勤務した高橋直暉さんによる寄稿です。はじめまして。株式会社モルフォでインターンをしていた高橋です。私のインターンシップでは、画像生成タスクの一つであるImage Inpaintingに取り組みました。このタスクは、毎年新しい手法が提案されており、近年では深層学習を導入した手法が主流です。今回は、シンプルで軽量なエッジ情報を用いたImage Inpainting手法[1]の改良に取り組みました。この記事では、インターンシップを通して得られた成果を紹介していきたいと思います。

2年前

ICML 2021 参加報告

Morpho Tech Blog

こんにちは、CTO室リサーチャーの長山と申します。モルフォでは最先端の画像処理・機械学習に関する研究のキャッチアップのため、国内外問わず毎年各種学会に技術系の社員を派遣しています。今回は機械学習の国際会議「International Conference on Machine Learning 2021（ICML 2021）」に長山と、同じくCTO室リサーチャーの鈴木・中川で参加しました。本投稿では、はじめに学会の概要について説明し、次に私が注目した論文3本を紹介します。

3年前

【無料トライアル公開中(~2021/12/31)】世界最速級推論エンジンSoftNeuroにおける高速化手法

Morpho Tech Blog

こんにちは、プロダクト開発部の平﨑です。今回は、弊社製品SoftNeuro®における推論処理の高速化手法についてご紹介します。なお、現在SoftNeuroの無料トライアル版が配布中です。 SoftNeuro概要詳細は後程解説しますが、まずは、SoftNeuroの特徴をまとめた紹介動画をご覧下さい。紹介動画の利用シーンからイメージいただけるかと思いますが、SoftNeuroはニューラルネットワークの推論を行うソフトウェアです。ディープラーニング技術を使って、コンピュータに何らかのタスクを実行させる場合、大きく分けて2つの工程が必要になります。それが「学習」と「推論」です。「学習」と…

3年前

モルフォ35時間ルール

Morpho Tech Blog

※この記事は、2021年５月25日に投稿した「Morpho's 35-hour Projects」の日本語版です。こんにちは。CTO室のシニアリサーチャーの茶民と申します。今回の記事では、各社員が業務時間中に自身の好きなプロジェクトを行えるモルフォの取り組みについてご紹介します。モルフォでの就業時間は一日平均7時間であり、月の合計で約161時間となります。モルフォでは、このうち20%の時間を各々の好きなプロジェクトの進行に割くことができます。プロジェクトの内容は、モルフォの業務に関係することであればなんでも構いません。月35時間の範囲内なら何をしても良いため、「35時間ルール」と呼ばれてい…

3年前

OJT2021：Vieureka を用いた三密判定と性格行動診断の同時推論「密カッター」

Morpho Tech Blog

こんにちは、リサーチャーの鈴木です。今年度の新人研修で、私達のグループは「密カッター」というシステムを開発しました。本記事では、このシステムの開発の目的、および、本システムで実装されている要素技術についてご紹介いたします。本研修ではPanasonic様の提供するIoTカメラ「Vieureka*1」を使用しました。「密カッター」による三密判定＋性格行動診断新型コロナウイルスの感染防止対策として「三密防止」が重要であることは言うまでもありません。「人が多数集まる密集状態」「換気が悪い密閉空間」「間近で会話や発声をする密接場面」を常時監視することは、店舗運営等において望ましい環境作りとなります…

3年前

OJT 2021 : Vieurekaを用いた駐車可能位置案内システム

Morpho Tech Blog

はじめまして、リサーチャーの木村と申します。私は本年4月に新卒としてモルフォに入社しました。今年の新人研修（OJT）において、私たちのチームは2ヶ月にわたってPanasonic様が提供するVieureka[^*1]というエッジデバイスを用いたアプリケーション開発を行いました。私たちのチームは、Vieureka を使った駐車可能位置案内システム ( Camera based Parking Guidance System ) を開発しました。この駐車可能位置案内システムは、Vieureka で撮影した駐車場の画像から車両検出により駐車場の空き状況を分析してWeb 上に簡易駐車場マップを表示し、…

3年前

(文献紹介) Google の COVID-19 感染予測

Morpho Tech Blog

こんにちは、CTO室リサーチャーの富田です。モルフォでは論文紹介を持ち回りで行うジャーナルクラブという活動がありますが、画像処理に関する論文に限らず、担当者が興味を持ったテーマについて紹介することもあります。Google Cloudが昨年公開した COVID-19 感染予測(US版、日本版) は大きな話題になりました。そのホワイトペーパーである "Interpretable Sequence Learning for COVID-19 Forecasting" についてこのジャーナルクラブで発表したので、こちらでもご紹介します。感染者などの時系列推移を学習するだけでなく、疫学の専門家や意思決…

3年前

Morpho's 35-hour Projects

Morpho Tech Blog

Hi everyone! I am Chamin, a senior boffin research engineer from Morpho's CTO Office. In this post, I will introduce Morpho's way of letting its members do their own fun projects during work time. At Morpho, our designated work time is seven hours a day (averaged over the month). Depending on the nu…

3年前

（文献紹介）デブラー手法の紹介

Morpho Tech Blog

こんにちは、CTO 室リサーチャーの三宅と申します。モルフォでは、学術論文の輪講を行う「ジャーナルクラブ」という有志による活動があります。今回は、このジャーナルクラブで発表した内容をご紹介いたします。イメージセンサーの露光中にカメラが動くことで、写真がボケてしまうことをモーションブラーといいます。モーションブラーは、スマホを手持ち撮影すると日常的に生じてしまう現象です。光学的な解決策のひとつとして、シャッタースピードを速くして露光時間を短くするというのがありますが、露光量が減るため今度はノイズが目立ってしまうというトレードオフがあります。したがって、画像処理によってモーションブラーを除去（…

3年前

画像分類タスクにおける半教師有り学習第2回

Morpho Tech Blog

こんにちは、モルフォリサーチャーの芳賀です。 1回目の記事では半教師有り学習の概要に始まり、ラベル有りデータとラベル無しデータを一度に学習に組み込むone-stage学習に焦点を当て、基本コンセプトである「consistency regularization」「entropy minimization」について具体的な手法を交えて紹介しました。 techblog.morphoinc.com 2回目の記事では最近に至るまでの数々の手法について紹介します。

3年前

Oculus Quest の Passthrough+ (疑似視点合成) の仕組み

Morpho Tech Blog

CTO室で研究開発を担当している松尾と申します。今回はいつもと若干毛色を変えて Virtual Reality (VR) 関係のトピックを紹介します。撮影された画像から復元された弊社の休憩スペース

3年前

画像分類タスクにおける半教師有り学習第1回

Morpho Tech Blog

こんにちは、モルフォリサーチャーの芳賀です。一般に機械学習で精度の高いモデルを作るためにはドメインに応じたたくさんの学習データが必要となります。しかし実際の業務においては、入力データは容易に集められてもアノテーションコストが問題になる場合があります。「手元にたくさんデータはあるけどアノテーションが大変。」そういうときにアノテーションラベルが付いていなくても学習データとして使う手法の一つに半教師有り学習（Semi-Supervised Learning）というものがあります。今回から3回に渡って、画像分類タスクにおいて半教師有り学習がどのように発展を遂げてきたかについて紹介します。

3年前

（文献紹介）Depth Completionの最新動向

Morpho Tech Blog

こんにちは、CTO室リサーチャーの角田です。私は、今年４月に新卒としてモルフォに入社しました。３ヶ月の OJT が終了し、現在私は測距センサーの情報を用いることで画像処理品質を向上させるための研究開発に取り組んでいます。この分野では “Depth Completion”と呼ばれる手法の研究が行われています。研究の一環として、この“Depth Completion”に関連する論文調査を行いましたので、本エントリにて概要を紹介させて頂きます。 Depth Completion 近年のモバイル端末はカメラの進化が著しいですが、近年ではLiDARやToFといった測距センサーも搭載されており、それらに…

3年前

（文献紹介）深層学習による動被写体ロバストなカメラの動き推定

Morpho Tech Blog

こんにちは、CTO 室リサーチャーの三宅と申します。モルフォでは、学術論文の輪講を行う「ジャーナルクラブ」という有志による活動があります。今回は、このジャーナルクラブで発表した内容をご紹介いたします。画像処理では、複数の画像を入力としたときに「それらを映したカメラの動き」を推定する問題がさまざまな用途で重要になります。ある幾何的性質を満たした画像間でカメラの動きを記述するモデルはありますが、実際に我々が推定に用いる画像は、そのようなきれいな性質を満たしているとは限りません。難しい設定の最たる例が「動いている被写体を動いているカメラで映す」場合です。今回ご紹介する論文は、今年の CVPR で発表…

3年前

（文献紹介）Deep Unrolling: Learned ISTA (LISTA)

Morpho Tech Blog

こんにちは。リサーチャーの長山です。今回は Deep Unrolling（あるいは Deep Unfolding、Algorithm Unrolling）と呼ばれる解釈可能性の高いディープラーニング手法を紹介します。昨今のディープラーニング手法の発展はめざましく、コンピュータビジョンやパターン認識などの様々な画像処理応用で高いパフォーマンスを達成し、既存の多くのモデルベース解析手法を置き換えるに至っています。物理プロセスに基づいてモデルや prior を手作業で設計する典型的なモデルベース手法と対照的に、ニューラルネットワークは現実データのサンプルから内部パラメータを決定することでモデルを…

4年前

ICML2020 参加報告前編

Morpho Tech Blog

初めまして。CTO室リサーチャーの野元です。モルフォでは最先端の画像処理・機械学習に関する研究のキャッチアップのため、国内外問わず毎年各種学会に技術系の社員を派遣しています。今回は ICML 2020(International Conference on Machine Learning 2020)にCTO室リサーチャーの川邉とともに参加しました。今回は学会の概要と私が注目した発表3件についてご紹介します。後編では「Evaluating Machine Accuracy on ImageNet」等について川邉から報告する予定です。

4年前

OJT2020：Vieureka を用いた 3D 人流モニタリング

Morpho Tech Blog

はじめまして、リサーチャーの三宅と申します。今年度の新人研修（OJT）において、Panasonic 様が提供する Vieureka *1というエッジ AI カメラデバイスを使用したアプリケーション開発を 2 か月間行いました。 tech.panasonic.com この記事では私たちのチームで開発した「Vieureka を用いた 3D 人流モニタリングシステム」の概要について紹介します。 *1:「Vieureka」および「Vieureka」ロゴはパナソニック株式会社の登録商標です。

4年前

OJT2020：Vieureka を用いた混雑状況の配信

Morpho Tech Blog

はじめまして、リサーチャーの植田と申します。今年の新人研修の一環として、Panasonic 様の提供する IoT カメラ Vieureka (VRK-C301) を使ったアプリケーションを自分たちで発案・設計・実装するという OJT 課題に挑戦しました。私たちのチームでは Vieureka が設置された場所の混雑状況を可視化して Web 配信するというシステムを開発しました。最近では COVID-19 の感染拡大防止のため密集・密接・密閉（いわゆる三密）を避けることが推奨されていますが、ユーザの視点からは目的地が実際にどれほど混雑しているのか事前に把握しづらいという課題があります。そ…

4年前

OJT2020：Vieurekaを用いた顔検出

Morpho Tech Blog

はじめまして、リサーチャーの中村と申します。私は本年4月に新卒としてモルフォに入社しました。今年の新人研修（OJT）において、私達のチームは2ヶ月にわたってVieurekaカメラというエッジデバイスを用いたアプリケーション開発を行いました。私達のチームでは、Vieurekaカメラ上で得られた顔認識結果をPCやクラウド上で共有することで遠隔でも玄関の状況や来訪者を知ることが出来るスマートインターホンを開発しました。アプリケーションの構造を下の図に示します。アプリケーションの構造。Vieurekaカメラ上でリアルタイム顔認識を行い、認識結果や動画をクラウド上で共有することが出来ます。そ…

4年前

Selected Research Papers from ICCP 2020

Morpho Tech Blog

Hi everyone! I am Chamin, a boffin researcher from Morpho's CTO Office. As members of Morpho's main R&D division, we regularly attend conferences on Computer Vision and Machine Learning. This helps us to keep in touch with the state of the art, and also gain insights to new research topics. So, one …

4年前

COVID-19 Project 第2回: 自動ミュート

Morpho Tech Blog

はじめまして。株式会社モルフォのソフトウェアエンジニア、神谷と申します。前回に引き続き、withコロナ時代の社会貢献として当社が考えたアイデア手で顔を触ったことを判定し、教えてくれる機能オンライン会議中に、しゃべっていないときは自動でマイクをミュートする機能のうち、２つめのアイデアについて紹介します。なお前回の記事はこちらです。

4年前