朝日新聞社 メディア研究開発センター
https://note.com/asahi_ictrad
朝日新聞社の研究開発チーム(通称「M研」)です。このブログでは、社内の技術者たちが、日々のお仕事や研究開発しているテーマ、実験的な「やってみた」記録などを、時に真面目に、時にゆるっと発信していきます。
フィード

In-Context LearningはTest-Time Computeの恩恵を受けられるか?
10

朝日新聞社 メディア研究開発センター
こんにちは。メディア研究開発センターの川畑です。今回のテックブログではin-context learningの性能を推論時間を利用することで伸ばすことができるか調査した結果を共有します。大規模言語モデル (LLM) が推論時に与えられるいくつかの事例 (few-shot examples) を用いて推論することをin-context learning (ICL) と呼びますが、ICLの性能はLLMに与える例の構成にセンシティブであることが知られています [1]。良い事例集合を構成できればICLによる推論の性能は高く出る一方、悪い事例集合ではICLの性能は低く出てしまいます。さらにこの事例集合は推論対象の個別のデータに対して類似度が高い事例集合を選択するなどして動的に構築することで良い結果が得られることも知られています [2]。続きをみる
1日前

【Cursor】高山植物名を自動識別&写真にラベリングするツールを作ってみた【Googleフォト連携】
朝日新聞社 メディア研究開発センター
こんにちは、朝日新聞社メディア研究開発センター(通称:M研)の杉野です。登山が趣味でして、日本百名山の制覇を目指しています。休日は山のことばかり考えているわけですが、最近の悩みの種は、どんどん増えていく登山写真の整理です。Googleフォトにアルバムを作っていますが、とあるこだわりのせいで写真の整理がなかなか進みません。そこで今回は、そんな悩みを題材として、今流行りのCursorに慣れる練習がてら作成したツールについて紹介します。続きをみる
22日前

日本語タスクでMany-Shot In-Context Learningを検証する
朝日新聞社 メディア研究開発センター
こんにちは。メディア研究開発センター(M研)の田口です。テックブログ執筆の順番が回ってきました。前回自分が書いたのは以下の記事です。続きをみる
1ヶ月前

【Ragas】日本語QAテストセットがうまく自動生成されない問題とその回避方法について
朝日新聞社 メディア研究開発センター
こんにちは、メディア研究開発センターの植木です。本記事では、RAGアプリケーションの性能評価ツールとして普及しつつあるPythonライブラリ「Ragas」の概要に触れたのち、日本語文書を用いる際に起きる問題とその回避方法について説明します。続きをみる
1ヶ月前

そのペンは誰が握っている?──AI・主権・規制をめぐって|ドイツ・ハイルブロンTECH 2025参加報告
朝日新聞社 メディア研究開発センター
メディア研究開発センターの浦川です。本稿では、去る5月末にドイツ・ハイルブロンで開催された国際会議 「TECH 2025」 に参加した際の模様をお届けします。ハイルブロンはワインの街としても有名だそうです(このあとちゃんとワインも飲みました)。続きをみる
2ヶ月前

ニューヨークで開催された INMA World Congress 2025 へ行ってきた話
朝日新聞社 メディア研究開発センター
AI 時代のメディア、とことん語られてました朝日新聞社メディア研究開発センター 田森です。今回のテックブログでは、ちょっと前(2025/05/19~23)にニューヨークで開催された「95th Annual INMA World Congress of News Media」というイベントに参加してきたので、そこで語られていたことについて要約をご報告します。続きをみる
2ヶ月前

【GIS】365日20℃生活☀️日本の平年気温データから適温で暮らし続ける方法を探る
朝日新聞社 メディア研究開発センター
はじめにメディア研究開発センターの石井です。データジャーナリズムのためのデータ分析、文章校正AI Typolessの開発などを担当しています。続きをみる
3ヶ月前

CursorでGoogle Apps Script(GAS)のAIコーディングしてみた
朝日新聞社 メディア研究開発センター
メディア研究開発センターの山本剛史です。最近、AIエージェントが大きな話題を集めています。私も話題のAIエディタ「Cursor」を試してみたところ、自分がよく利用しているGoogle Apps Scriptでは非常に高精度なスクリプトを生成してくれて驚きました。そこで、Google Apps Script (GAS) でのプログラミングに焦点を当て、その使用感や具体的な成果について共有したいと思います。続きをみる
3ヶ月前

皆がGrokに何を聞いているのかを調べてみた(使用技術編)
朝日新聞社 メディア研究開発センター
メディア研究開発センターの新妻です。先日、withnewsにこういう記事を書きました。 みんなgrokに何を聞いている?データを分析、やっぱり多いのは…最近Xでよく見かけるのが、誰かの投稿に「@grok ファクトチェック」とリプライするものです。どれぐらい使われているのだろwithnews.jp 続きをみる
4ヶ月前

猫日記作ってみた【猫テックはじめました】
朝日新聞社 メディア研究開発センター
こんにちは。メディア研究開発センターの嘉田です。普段はコンテンツ制作支援サービスALOFAのML・バックエンド・インフラ開発を担当しています。ALOFAは先日ランディングページを公開し、現在ウェイトリストを募集中です。文字起こしやファイル管理にお困りの方はぜひ登録してみてください! 朝日新聞社 - 最先端の文字起こし&編集ツール ALOFAALOFAは記者向けの高品質な文字起こし・コンテンツ制作支援サービスです。インタビューや会見、会議などの音声を手軽にアップalofa.asahi.com 続きをみる
5ヶ月前

EMNLP 2024 に参加してきた話
朝日新聞社 メディア研究開発センター
こんにちは。メディア研究開発センター (M研) の川畑です。昨年11月にアメリカのマイアミにて開催された EMNLP 2024 に論文が本会議採択され現地参加してきました。今回の記事では採択論文と個人的に面白かった論文の内容紹介を行います。続きをみる
6ヶ月前

生成AIは間違い探しをどれだけ解けるのか?ChatGPT o1 VS Gemini 2.0 Flash
朝日新聞社 メディア研究開発センター
メディア研究開発センターの山本です。「生成AIは人間を超えた!」と言う声をよく聞くようになりました。OpenAIはChatGPT o1、GoogleはGemini2.0 Flashと2024年末に優れたモデルを発表し、さらにパワーアップしています。しかし、私はまだ生成AIが人間を超えられたとは思っていません。私が考える生成AIが人類を超えたと言えるタイミングは「サイゼリヤの間違い探しが解ける」です(異論認めます)。そういえば、間違い探しを生成AIに解かせるというタスクに取り組んだ情報を見かけないなと思い、それなら自分でやってみようと実験してみました。続きをみる
6ヶ月前

エンジニアの男性育休ログ1年分!会社報告から育休取得、職場復帰まで
朝日新聞社 メディア研究開発センター
メディア研究開発センターの山本剛史です。私は2023年10月に第一子が誕生し、1年間の男性育休を取得していました。おかげさまで1年間育児に専念できて、娘の成長をそばで感じることができました。エンジニアのキャリアを考える中で、育休について悩まれる方も多いです。そこで、いつ会社に報告して育休取得したか、引き継ぎで苦労したポイント、周りからの反応、育休復帰までの流れを紹介したいと思います。※本記事はQiitaアドベントカレンダーに掲載した記事の続編として、育休復帰までの流れを加筆して作成しました。続きをみる
7ヶ月前

マルチモーダルLLMでユーザビリティテストしてみた。
朝日新聞社 メディア研究開発センター
こんにちは、メディア研究開発センターの植木です。本記事ではマルチモーダルLLMであるGPT-4oを用いてユーザビリティテストがどの程度できるかを検証しました。続きをみる
8ヶ月前

AWS Lambda SnapStartを試してみた
朝日新聞社 メディア研究開発センター
こんにちは。メディア研究開発センターに所属する村瀬です。今回のノートでは、最近Pythonと.NETの実行環境でサポートされたAWS Lambda SnapStartについて試してみようと思います。お付き合いいただけますと幸いです。Lambda SnapStartとは続きをみる
8ヶ月前

メディアにおけるマルチモーダルAI技術の応用
朝日新聞社 メディア研究開発センター
こんにちは。朝日新聞社メディア研究開発センター(M研)の福沢です。今回はマルチモーダルAI技術と、そのメディアにおける応用について、お話させて頂きます。最近、ChatGPTの盛り上がりとともに、マルチモーダルAI技術にも大きな注目が集まっています。我々メディアにおいても、テキスト、写真、音声、映像などのさまざまな形式のデータの活用が一つの課題となっています。発信の仕方も、テキストや画像だけでなく、動画や音声、さらにインタラクティブな体験を求められるようになっており、マルチモーダル技術を利用することで、読者の皆様の体験を向上することができると考えております。続きをみる
9ヶ月前

AIが作家の断片を辿って“幻視”する物語/水戸芸術館『田村友一郎 ATM』に寄せて
朝日新聞社 メディア研究開発センター
2024年11月2日より、茨城県水戸市の水戸芸術館 現代美術ギャラリーにて、現代美術作家である田村友一郎氏の大規模個展「ATM」が開幕した。続きをみる
9ヶ月前

【作業に集中したいから】Notionマイタスクで複数プロジェクト管理&ドキュメント化
朝日新聞社 メディア研究開発センター
こんにちは。マルチタスクが苦手なのにプロジェクトを掛け持ちしすぎているM研の杉野です。今年2024年にリリースされ、Notion愛好家?の間で賞賛されている「マイタスク」機能をご存知でしょうか?複数プロジェクトを皿回しする民にとって、これは救世主だと思うほど良い機能であると、今さら気づきました。今回はその「マイタスク」を使い、さらにその日のタスクに集中しやすくなるためのカスタマイズから、ドキュメント漏れやドキュメント迷子の悩みを解決する工夫までご紹介します。 タスクデータベースを活かした、あなた専用のホームNotionの「タスク」データベースを使用すると、ホームからすべてのタスクを簡単に管理できます。www.notion.so 続きをみる
10ヶ月前

mackerelでオンプレサーバーの監視を強化してみたら幸せになった
朝日新聞社 メディア研究開発センター
いつもM研テックブログをご覧いただきまして、ありがとうございます。朝日新聞社メディア研究開発センター(M研)の田森です。さて、M研では研究用のGPU搭載サーバーをはじめとして、何台かのオンプレサーバーやNASが存在します。続きをみる
10ヶ月前

Pythonで扱う地理情報データ! 面と点の内外判定で土砂災害警戒区域の「盲点」を探る
朝日新聞社 メディア研究開発センター
こんにちは。朝日新聞社メディア研究開発センターの石井奏人です。突然ですが、みなさんは土砂災害警戒区域についてご存知でしょうか。土砂災害が起こる危険性のある箇所を、各都道府県が土砂災害防止法に基づき指定したものです。続きをみる
1年前

LLMによる日本語タイポ修正ベンチマーク
朝日新聞社 メディア研究開発センター
こんにちは。メディア研究開発センター(通称M研)の田口です。昨年6月末にこんな記事を書きました。このときはgpt-35-turbo、text-davinci-003を使っていて今読み返すと隔世の感ですね…続きをみる
1年前

モノに関わる職業をLLMで分析!
朝日新聞社 メディア研究開発センター
今回やったこと・Azure OpenAI Serviceのapiで、gpt-4oを使用 ・プロンプトの工夫(結果をpythonのリスト形式で出力したい) ・画像認識・pythonで関係図を作る(ネットワークグラフ)続きをみる
1年前

LLMは文分類を抽象的に学ぶことはできるか?
朝日新聞社 メディア研究開発センター
メディア研究開発センターの新妻です。LLMのブーム、すごいっすよね。(この記事においては、LLMは大規模なdecoder onlyな言語モデルを指して使います。)自分も最近は継続事前学習とか頑張ってます。NLPには文分類(sentence classification)という基礎的なタスクがあります。具体的なタスクで言えば、含意関係認識や感情解析などの与えられた文に対して限られた選択肢からラベルを付与するようなタスクです。続きをみる
1年前