朝日新聞社 メディア研究開発センター

https://note.com/asahi_ictrad

朝日新聞社の研究開発チーム(通称「M研」)です。このブログでは、社内の技術者たちが、日々のお仕事や研究開発しているテーマ、実験的な「やってみた」記録などを、時に真面目に、時にゆるっと発信していきます。

フィード

記事のアイキャッチ画像
マルチモーダルLLMでユーザビリティテストしてみた。
朝日新聞社 メディア研究開発センター
こんにちは、メディア研究開発センターの植木です。本記事ではマルチモーダルLLMであるGPT-4oを用いてユーザビリティテストがどの程度できるかを検証しました。続きをみる
12日前
記事のアイキャッチ画像
AIの言葉、私の言葉––いま、生成する前に立ち止まる
朝日新聞社 メディア研究開発センター
はじめに続きをみる
13日前
記事のアイキャッチ画像
ChatGPTで2025年の流行語予想してみた~o1 proでやりゃええやん~
朝日新聞社 メディア研究開発センター
はじめに続きをみる
16日前
記事のアイキャッチ画像
AWS Lambda SnapStartを試してみた
朝日新聞社 メディア研究開発センター
こんにちは。メディア研究開発センターに所属する村瀬です。今回のノートでは、最近Pythonと.NETの実行環境でサポートされたAWS Lambda SnapStartについて試してみようと思います。お付き合いいただけますと幸いです。Lambda SnapStartとは続きをみる
24日前
記事のアイキャッチ画像
メディアにおけるマルチモーダルAI技術の応用
朝日新聞社 メディア研究開発センター
こんにちは。朝日新聞社メディア研究開発センター(M研)の福沢です。今回はマルチモーダルAI技術と、そのメディアにおける応用について、お話させて頂きます。最近、ChatGPTの盛り上がりとともに、マルチモーダルAI技術にも大きな注目が集まっています。我々メディアにおいても、テキスト、写真、音声、映像などのさまざまな形式のデータの活用が一つの課題となっています。発信の仕方も、テキストや画像だけでなく、動画や音声、さらにインタラクティブな体験を求められるようになっており、マルチモーダル技術を利用することで、読者の皆様の体験を向上することができると考えております。続きをみる
1ヶ月前
記事のアイキャッチ画像
AIが作家の断片を辿って“幻視”する物語/水戸芸術館『田村友一郎 ATM』に寄せて
朝日新聞社 メディア研究開発センター
2024年11月2日より、茨城県水戸市の水戸芸術館 現代美術ギャラリーにて、現代美術作家である田村友一郎氏の大規模個展「ATM」が開幕した。続きをみる
2ヶ月前
記事のアイキャッチ画像
【作業に集中したいから】Notionマイタスクで複数プロジェクト管理&ドキュメント化
朝日新聞社 メディア研究開発センター
こんにちは。マルチタスクが苦手なのにプロジェクトを掛け持ちしすぎているM研の杉野です。今年2024年にリリースされ、Notion愛好家?の間で賞賛されている「マイタスク」機能をご存知でしょうか?複数プロジェクトを皿回しする民にとって、これは救世主だと思うほど良い機能であると、今さら気づきました。今回はその「マイタスク」を使い、さらにその日のタスクに集中しやすくなるためのカスタマイズから、ドキュメント漏れやドキュメント迷子の悩みを解決する工夫までご紹介します。 タスクデータベースを活かした、あなた専用のホームNotionの「タスク」データベースを使用すると、ホームからすべてのタスクを簡単に管理できます。www.notion.so 続きをみる
2ヶ月前
記事のアイキャッチ画像
mackerelでオンプレサーバーの監視を強化してみたら幸せになった
朝日新聞社 メディア研究開発センター
いつもM研テックブログをご覧いただきまして、ありがとうございます。朝日新聞社メディア研究開発センター(M研)の田森です。さて、M研では研究用のGPU搭載サーバーをはじめとして、何台かのオンプレサーバーやNASが存在します。続きをみる
2ヶ月前
記事のアイキャッチ画像
Pythonで扱う地理情報データ! 面と点の内外判定で土砂災害警戒区域の「盲点」を探る
朝日新聞社 メディア研究開発センター
こんにちは。朝日新聞社メディア研究開発センターの石井奏人です。突然ですが、みなさんは土砂災害警戒区域についてご存知でしょうか。土砂災害が起こる危険性のある箇所を、各都道府県が土砂災害防止法に基づき指定したものです。続きをみる
3ヶ月前
記事のアイキャッチ画像
LLMによる日本語タイポ修正ベンチマーク
朝日新聞社 メディア研究開発センター
こんにちは。メディア研究開発センター(通称M研)の田口です。昨年6月末にこんな記事を書きました。このときはgpt-35-turbo、text-davinci-003を使っていて今読み返すと隔世の感ですね…続きをみる
4ヶ月前
記事のアイキャッチ画像
モノに関わる職業をLLMで分析!
朝日新聞社 メディア研究開発センター
今回やったこと・Azure OpenAI Serviceのapiで、gpt-4oを使用 ・プロンプトの工夫(結果をpythonのリスト形式で出力したい) ・画像認識・pythonで関係図を作る(ネットワークグラフ)続きをみる
4ヶ月前
記事のアイキャッチ画像
LLMは文分類を抽象的に学ぶことはできるか?
朝日新聞社 メディア研究開発センター
メディア研究開発センターの新妻です。LLMのブーム、すごいっすよね。(この記事においては、LLMは大規模なdecoder onlyな言語モデルを指して使います。)自分も最近は継続事前学習とか頑張ってます。NLPには文分類(sentence classification)という基礎的なタスクがあります。具体的なタスクで言えば、含意関係認識や感情解析などの与えられた文に対して限られた選択肢からラベルを付与するようなタスクです。続きをみる
4ヶ月前
記事のアイキャッチ画像
GPT-4oは画像の座標情報を理解しているのか?
朝日新聞社 メディア研究開発センター
こんにちは。朝日新聞社メディア研究開発センターの嘉田です。早速ですが、みなさんはGPT-4oを使っていますか?GPT-4oは画像認識精度も上がっていて日本語OCRもできる!と評判ですが、バウンディングボックスも出力できるのか?そもそもGPT-4oは画像の座標情報をどの程度扱えるのだろうか?と疑問に思い、検証することにしました。続きをみる
5ヶ月前
記事のアイキャッチ画像
LLMを使ったかな漢字変換
朝日新聞社 メディア研究開発センター
こんにちは。メディア研究開発センターの山野です。私は普段は音声処理や自然言語処理やそれらの技術を使ったプロダクト開発などに従事しています。さて今回は朝日新聞記事データを使ったニューラル仮名漢字変換について簡易な実験をしたのでその結果を共有します。続きをみる
6ヶ月前
記事のアイキャッチ画像
【LLM】Few-shot推論は言語化の壁を越えられるか
朝日新聞社 メディア研究開発センター
こんにちは。メディア研究開発センターの川畑です。みなさん ChatGPT 使ってますか?便利ですよね。何か訊いたら大概のことは正確に教えてくれますし、論文等の文書もわかりやすくまとめてくれたりと万能な存在です。そんな便利な ChatGPT もとい LLM (large language model) ですが、その知識を引き出すためには質問や指示をキチンと言葉にしなければいけません。ちゃんと指示を言葉にする、というのは一見すれば簡単なことですが、何度もチャットしていると面倒さゆえに指示文が適当になったり、そもそも知識の不足ゆえに指示文として言語化するのが難しいシチュエーションもありますよね。たとえばプログラミング初心者の人が ChatGPT を使う状況を想定してみると、〇〇のようなプログラムを書きたいという漠然としたイメージはあっても具体的な処理の詳述まではできないかもしれません。そしていくら高性能な LLM といっても、そもそもの入力指示が曖昧であればそのポテンシャルを発揮できないでしょう。ただ一方で、指示文として言葉にすることはできなくとも、いくつかの例を示すことはできるかもしれません。たとえば「こんな風な文章を書いて」という指示と共にお手本の文章を羅列したり、「コードにこんな処理を追加して」という指示と共に処理の実行例を持ってきて自分のコードに組み込んでもらったり...。前置きが長くなりましたが、今回のテックブログではそんな「やってほしいことのイメージはあるけど正確に指示を言葉にすることが難しい」状況で LLM がどれほどの能力を発揮できるのか、という疑問を自由研究的に検証します!続きをみる
6ヶ月前
記事のアイキャッチ画像
LLMのTraceabilityについて素人が考えてみた
朝日新聞社 メディア研究開発センター
はじめにメディア研究開発センターの村瀬です。よろしくお願いします。今回のブログはLLMやDeep Learningについて初学者の私がLLMのTraceabilityについて考えてみたという内容でお送りします。続きをみる
6ヶ月前
記事のアイキャッチ画像
『AIは短歌をどう詠むか』という本
朝日新聞社 メディア研究開発センター
はじめにみなさん、こんにちは。メディア研究開発センター(M研)の浦川です。私は普段、自然言語処理(書き言葉から話し言葉まで、日常生活で普通にヒトが使う言葉をコンピュータで扱うこと)に関する研究開発に従事しています。これまでに、自動で記事の見出しを生成する「TSUNA」や、短歌を生成する「短歌AI」などに携わってきました。続きをみる
7ヶ月前
記事のアイキャッチ画像
【Presented by AWS Japan】 DynamoDB勉強会を開催してもらいました
朝日新聞社 メディア研究開発センター
こんにちは!朝日新聞社メディア研究開発センターの嘉田です。今回は、先日AWSさんに開催していただいたDynamoDB勉強会についてご紹介します。経緯続きをみる
8ヶ月前
記事のアイキャッチ画像
LLMは本当になんでも得意なの?TSUNAの文字数コントロールを検証
朝日新聞社 メディア研究開発センター
朝日新聞社メディア研究開発センター 田森です。ゴールデンウィークがいよいよ始まりますね。メディア研究開発センターも4月には新年度を迎えワチャワチャしていましたが、月末になりようやく落ち着きを見せてきました。ようやく、ようやく、要約。ということで、今回のテックブログは自然言語処理における要約タスクとLLMの最近について書いてみたいと思います。このブログは、NLP2024のワークショップ「生成AI時代の自然言語処理における産学官の役割と課題」で発表するにあたり、調査した内容について書いています。このワークショップでは、LLMの特定のタスクに対する影響について「産」の立場から報告する場をいただきまして、今回は「要約タスク」における影響について報告しました。なお、実験にあたっては以前、弊社・田口が発表した「ChatGPTを活用した見出し作成支援の検証」にならい、利用するモデルを変えて再実験をしたものです。自動要約生成API「TSUNA」続きをみる
8ヶ月前
記事のアイキャッチ画像
SAR衛星画像で能登半島地震の被災状況を把握する初めてのトライ
朝日新聞社 メディア研究開発センター
はじめに地震や、台風などの自然災害が発生した時に、一番重要なのは被害状況を迅速に把握することです。それによって、迅速かつ適切な救援や、復旧、生活再建活動を行うことができます。災害地の状況を迅速に把握するために、衛星画像を解析した結果を利用することができます。続きをみる
8ヶ月前
記事のアイキャッチ画像
焼酎を飲むのは九州の人ばかり?オープンデータでお酒の消費の地域差を分析!🍶
朝日新聞社 メディア研究開発センター
こんにちは。福岡生まれの石井です。4月で入社3年目になります。最近、焼酎が飲めるようになりました。焼酎はお酒の中でも大人なイメージで、クセも強いかなあと思っていたのですが、友人の勧めで試しにソーダ割で飲んでみたところ、すっかりハマってしまいました。幼少期に、ふざけて祖父の飲む焼酎の匂いを嗅がせてもらっていたから独特な香りへの抵抗がなかったのでしょうか(もちろん当時は飲んでいません)。続きをみる
9ヶ月前
記事のアイキャッチ画像
桜だより〜関西地方の開花推移〜
朝日新聞社 メディア研究開発センター
こんにちは。メディア研究開発センターの河﨑です。春ですね。大都会東京の花粉の多さに慄きながら、日々過ごしています。(私の大好きな故郷大阪よりも花粉が多いそうで、、やってられないです)続きをみる
10ヶ月前
記事のアイキャッチ画像
AWS Inf2によるモデル推論―コンパイルから速度比較まで
朝日新聞社 メディア研究開発センター
こんにちは。メディア研究開発センター(通称M研)の田口です。今回はAWSのInf2インスタンスを使ったモデル推論の方法を紹介します。続きをみる
1年前
記事のアイキャッチ画像
朝日新聞社技術職(特にM研)への就職をご検討の皆様向けまとめページ(2023-24)
朝日新聞社 メディア研究開発センター
朝日新聞社メディア事業本部メディア研究開発センター(M研)の田森です。このnoteは、少しでも弊社、特にM研への就職にご興味がある方に向けて、最近の活動をまとめたものです。ご参考になれば幸いです。続きをみる
1年前
記事のアイキャッチ画像
はじめての特許出願【デジタルアーカイブの取り組み】
朝日新聞社 メディア研究開発センター
こんにちは。メディア研究開発センター(M研)の嘉田です。いきなりですが…続きをみる
1年前