Tech Blog - Turingのフィード

https://zenn.dev/p/turing_motors

LV5完全自動運転EVを開発するAIテクノロジースタートアップ・Turing株式会社の公式テックブログです。

フィード

記事のアイキャッチ画像
GAIA-1: 自動運転のための世界モデルを理解する
はてなブックマークアイコン 2
Tech Blog - Turingのフィード
1. はじめにTuring 生成AIチームの荒居です。生成AIチームでは、完全自動運転の実現に向けて、現実世界の複雑な状況を理解し未来を予測するAI、「世界モデル」の開発に取り組んでいます。世界モデルは、生成AIによって様々な交通状況や歩行者の行動をシミュレーションすることを可能にし、安全かつ効率的な自動運転を実現するための重要な鍵となると私たちは考えています。 この記事で解説している内容:世界モデルとは何か世界モデルの開発はなぜ自動運転に重要なのか世界モデルGAIA-1について 2. 世界モデルとは世界モデルとは、現実世界の物理法則や因果関係、物体間の相互作用...
8日前
記事のアイキャッチ画像
言語モデルを高位合成でFPGAに実装してみた
Tech Blog - Turingのフィード
言語モデルを高位合成でFPGAに実装してみたTuring株式会社のリサーチチームでインターンしているM1の内山です。Turing株式会社では大規模基盤モデルによる完全自動運転を目指しており、その実現に欠かせない技術として大規模言語モデルの研究開発を行っています。Generative AILLMの広範な知識と思考能力に加え、視覚情報やセンサーデータなどの多様な入力を受け入れることで、車の周囲の状況を正確に認識します。さらに、世界モデルを適用することで、高度な空間認知と身体性を獲得し、実世界に対応した生成AIを実現します。https://tur.ing/ より引用しかしな...
16日前
記事のアイキャッチ画像
Heron-Bench: 日本語Vision&Languageモデルの性能評価ベンチマークの公開
Tech Blog - Turingのフィード
はじめにTuring Researchチームの佐々木(kento_sasaki1)です。Researchチームでは、完全自動運転の実現に向けて、マルチモーダル基盤モデルの開発に取り組んでいます。先日、私たちは日本語Vision Language Model (VLM) のベンチマーク「Heron-Bench」を新たに公開しました。本記事ではHeron-Benchについて解説し、日本語VLMの現状と今後の展望について述べます。詳細についてはarXiV論文 「HERON-BENCH: A BENCKMARK FOR EVALUATING VISION LANGUAGE MODELS ...
25日前
記事のアイキャッチ画像
今こそはじめるJAX/Flax入門 Part 1
Tech Blog - Turingのフィード
1. はじめに2012年から始まった深層学習の発展の過程で、さまざまな学習フレームワークが登場しました。中でもPyTorchとTensorflowは最も広く使われており、それぞれのフレームワークが支持されている背景には、柔軟性、拡張性、そして使いやすさがあります。一方で、これらのフレームワークはその機能を拡張し続けてきた結果として、全体として非常に巨大で複雑なライブラリになっています。そのため、独自に機能拡張を行いたいユーザーにとっては扱いづらく、性能的にもオーバーヘッドを感じさせることがあります。そこで新たに出てきたのが「JAX」とその関連ライブラリの組み合わせになります。...
1ヶ月前
記事のアイキャッチ画像
Jetson AGX Orinでグラボを動かした話
Tech Blog - Turingのフィード
最近、ラズパイにグラボを接続した、ルーターにGPUを接続したなど、いろんなものにGPUを繋げるのが流行っているようですが、似たようなことをJetsonでやったという記事です。設定方法だけ書くとわりと短いので、最初に経緯などを書いています。結論だけ欲しい方は、こちらに飛んでください。 はじめにJetson AGX Orinというのは、NVIDIAが開発しているエッジコンピューティング向けのモジュール製品で、エッジ環境としては非常に強力なAI能力(200~275TOPS)を持っています。https://www.nvidia.com/ja-jp/autonomous-machine...
2ヶ月前
記事のアイキャッチ画像
日本語Vision Languageモデル heron-blip-v1の公開
Tech Blog - Turingのフィード
はじめにTuringでは完全自動運転実現に向けて、LLMやそれを用いたVision Langauge(V&L)モデルの開発に取り組んでいます。最近は経済産業省/NEDOの「競争力のある生成AI基盤モデルの開発を支援する「GENIACプロジェクト」」にも採択されるなど、大規模な生成AIの開発に精力的に取り組んでいます。特に、Vision Languageモデルについては、Heronというライブラリとモデル群を公開しており、今回は新しいモデルとその学習レシピを公開します。また、日本語のV&LモデルをGPT-4を用いて評価するためのプログラムも公開します。 Hero...
2ヶ月前
記事のアイキャッチ画像
GoogleTest/gMockを用いたC++ユニットテストの導入ガイド
Tech Blog - Turingのフィード
はじめにTuring UXチームでソフトウェアエンジニアをしています佐々木 (kento_sasaki1) です。Turingは「We Overtake Tesla」をミッションに完全自動運転EVメーカーを目指すスタートアップです。UXチームでは車載ソフトウェアの開発を行っており、ユーザーインターフェースからハードウェア抽象化レイヤに至るまで幅広い範囲を担当しています。本記事では、ハードウェア抽象化レイヤ (HAL) のC++実装に焦点を当て、C++テストフレームワークであるGoogleTest, gMockを用いたユニットテストの導入方法について紹介します。さらに、実践編とし...
2ヶ月前
記事のアイキャッチ画像
Vision-Launguageモデルで走行データベースと動画検索システムを作る
Tech Blog - Turingのフィード
Turing株式会社の自動運転チームでインターンしている東大B3の大野です。自動運転チームでは、完全自動運転の実現を目指して自動運転AIを開発しています。モデル開発の際に、「雨の日に高速を走っていて先行車がいない」や「交差点で歩行者がいる中、右折している」など、特定の状況の走行データが必要になることがあります。今回私は、動画に対して天気や歩行者の数などのラベルをデータベース化し、検索できるシステムを、Vision-Languageモデルを使って開発しました。この記事では、このシステムの作成にあたって取り組んだことについて説明します。作成したGUI 課題Turingでは、走行パ...
4ヶ月前
記事のアイキャッチ画像
最新の自動運転研究 in NeurIPS2023
Tech Blog - Turingのフィード
TuringでResearcherをしているいのいちです。先日、会社にサポートしていただいてニューオーリンズで開催されたNeurIPS 2023に参加させていただくことができたので、今年のNeurIPSで発表された自動運転系の論文をいくつかピックアップして紹介しようと思います。 NeurIPSとはNeurIPSは1987年から開かれている機械学習系でトップの国際会議です。この会議が発足した当初はBiologicalとArtificialの両方の側面からニューラルネットワークを研究しようという趣旨があり、長らく神経科学からも理解しようという趣旨があったようです。現在はこの国際会議...
5ヶ月前
記事のアイキャッチ画像
物体検出もセグメンテーションもテキストでやりたい!
Tech Blog - Turingのフィード
アドベントカレンダー22日目を担当します!モデル開発チームの塩塚です。本日は金曜日で、このままクリスマス突入ですね。そしてそのまま年末年始を迎えるこの時期は少しだけ楽をしたいですよね。そんな我々にピッタリの機械学習リポジトリがあります。それがこちら Language Segment-Anything です。公式リポジトリより引用こちらのオープンソースプロジェクトは、画像とテキスト入力だけで物体検出・セグメンテーションをしてくれます。とても便利ですね。従来は、物体検出・セグメンテーションしたいときに、検出したいオブジェクトに対応したモデルを探して、探しても画像のサイズや画角によっ...
5ヶ月前
記事のアイキャッチ画像
Swiftでllama.cppを使いたい!
Tech Blog - Turingのフィード
今年の流行語といえばLLMですが、中でもローカルLLMの技術がプログラマ的には気になります。何かに使えそう!そこでローカルLLMの代名詞である(?)llama.cppを眺めていたところ、堂々とPackage.swiftがあるのに気づきました。https://github.com/ggerganov/llama.cpp/tree/masterということは、自力で難しいことをしなくても、簡単にSwiftから利用できそうです。今更感もありますが、この記事ではllama.cppをSwiftから使って色々遊んでみたいと思います。この記事は私のインターン先であるTuringアドベントカ...
5ヶ月前
記事のアイキャッチ画像
KotlinからWhisperAPIを使う
Tech Blog - Turingのフィード
はじめにTuring株式会社のアドベントカレンダー20日目!今回は、UXチームの井上(@yoinoue5212)が担当します!UXチームではAndroidベースのIVIシステム開発を進めています。ちなみに、IVIシステムとは、速度計などを表示する計器クラスター部分と、ナビやエンタメを提供するセンターディスプレイ部分を総称した概念です。UXを意識するうえで、より簡単に、よりシンプルに、デバイスを操作するための方法として、"OK, Google. ~やって"のようなボイスアシスタント機能が考えられます。本記事では、そんな便利なボイスアシスタントを作るための第一歩である音声認...
5ヶ月前
記事のアイキャッチ画像
自動運転ってどこまでdeep de ponできるの?
Tech Blog - Turingのフィード
1.はじめにTuringで自動運転の開発をしている猪狩と申します。現在、私達のチームは2024年末リリース予定の少量生産車に搭載される自動運転システムの開発を行っております。Turing では以前より「end-to-end deep learning modelによる自動運転システム」を謳っているわけですが、いま現在deep learningモデルがどこまで運転操作を代替できるのか、2024年末リリース予定の少量生産車に搭載されるADASシステムの開発者の視点から紹介出来ればと思います。 2.Deep vs ルールベースまずは、Deep learning と、それを使わない場...
5ヶ月前
記事のアイキャッチ画像
llama.cpp の動かし方と量子化手法
Tech Blog - Turingのフィード
はじめにTuringアドベントカレンダー17日目です!今日は Research チームの柏谷が担当します。Research チームでは、LLMによる完全自動運転を実現するための技術開発を行っています。その中で重要な技術の1つが量子化です。量子化によって少ビットでパラメータを表現できれば、LLM の膨大なパラメータのデータ圧縮が可能となります。量子化実装はいろいろと考えられますが、今回は実装にアクセス可能な llama.cpp とその量子化技術について見ていきましょう!llama.cpp とは Georgi Gerganov さんが作った PC の CPU だけで LLM が動...
5ヶ月前
記事のアイキャッチ画像
GPT Builderで保安基準GPTを作ってみた
Tech Blog - Turingのフィード
はじめにTuring UXチームでソフトウェアエンジニアをしています佐々木(kento_sasaki1)です。Turingは「We Overtake Tesla」をミッションに掲げ、2030年に完全自動運転EVの10,000台量産を目指すスタートアップです。本記事は、Turingアドベントカレンダー15日目の記事です。今回、手軽に試せるGPTsの機能を用いて「保安基準GPT」を作ってみたので、その概要について紹介します。https://x.com/kento_sasaki1/status/1732420894868550012?s=20「保安基準GPT」は、以下のリンクから使...
5ヶ月前
記事のアイキャッチ画像
自動運転開発におけるシミュレータ活用
Tech Blog - Turingのフィード
Turingの機械学習モデル開発チームの@hidetatzです。Turingアドベントカレンダー14日目の記事です。TuringはAIによる完全自動運転車を開発するスタートアップです。この記事では、自動運転車というプロダクトを開発するために重要なシミュレータについて、Turingがどう活用しているかを書きます。 シミュレータとは?自動運転の文脈において、シミュレータは車を運転する実際の道路環境をPC上で再現するためのソフトウェアのことを指します。シミュレータは、複雑な交通状況や天候の変化、さまざまな道路のレイアウトなど、現実世界の多様な条件を精密に模倣することができます。私達...
5ヶ月前
記事のアイキャッチ画像
アニメーションでDeepSpeed (ZeRO1)の仕組みを完全に理解する
Tech Blog - Turingのフィード
Turingのリサーチチームで完全自動運転の研究開発を行なっている棚橋です。Turingアドベントカレンダー14日目の記事として、DeepSpeedについて取り上げます。DeepSpeedはMicrosoftによって開発されたライブラリで、一言で言うと、「1つのGPUに乗り切らないような巨大MLモデルをなんとか学習させるため」のツールです。特に、この論文で提案されているDeepSpeedのZero Redundancy Optimizer (ZeRO)という技術が非常に注目されています。また、DeepSpeedが昨今の大規模言語モデルの学習に多く利用されています。詳細は過去の記事を...
5ヶ月前
記事のアイキャッチ画像
GMSLカメラをなんとなく理解する
Tech Blog - Turingのフィード
Turing Advent Calendar 2023の9日目の記事です。本日は組込みソフトウェアエンジニアのやべ(@ken_ya_be)が担当です。今年の10月からTuringに在籍し、直近開発している車両の自動運転まわりのところをやっています。何かしらやってみた系の内容を書くのが好きなのですが、在籍期間短くてネタがなかったので、今回は調べもの記事を書いてみました。 はじめにこれを読むとGMSLカメラのことがなんとなくわかるようになる。いろいろな規格が絡んできて深みにハマりがちなので、極力触りだけになるよう努めます。とりあえずざっと読めば、GMSLカメラの仕様を見て「ふむふ...
5ヶ月前
記事のアイキャッチ画像
ここまで進化している!?車載向けSoCとその活用
Tech Blog - Turingのフィード
はじめにTuring の Vehicle チームの徳弘 (@res_circuit) です。Turing は、完全自動運転システムを搭載した車を商品として販売することを目指しており、量産を見据えた独自の車両システムの設計に取り組んでいます。Turing ではその一環として、ECU (Electronic Control Unit, 電子制御ユニット) の開発にも取り組んでいます。車の制御装置であるECUの多くは、マイコンをベースに構成されています。しかし近年は、車に求められる機能が膨大になり、またそれを処理するために高い計算力も必要となってきています。そのため、いわゆるMCU...
5ヶ月前
記事のアイキャッチ画像
Turingの未来の拠点立地について考える
Tech Blog - Turingのフィード
Turingの未来の拠点立地について考えるTuringアドベントカレンダー7日目です!今日はVehicleチームの山口が担当します。最近Xのカッパッパさんの取材や、前回のテックブログで車両開発チームの黎明期から現在までの間(といっても1年もたっていない)を赤裸々に語らせていただきましたが、今回は「これから」を見据えて取り組んだことの一端を書きます。 Turingの車両開発計画と現状Turingでは、今後のマイルストーンとして2025年に100台、2027~2028年に1000台、2030年に10,000台の量産開発計画を掲げています。足元はセル生産、ファブレス生産でマーケ...
5ヶ月前