fuku Tech Blog
https://blog.fuku-inc.com/
fuku Tech Blog
フィード
Nature誌の論文はbioRxivにPreprint版があるか?
fuku Tech Blog
背景 基盤モデルの発達により論文を扱ってさまざまなことができるようになりました。 しかし、ライフサイエンス領域において未だオープンアクセスが世の主流とは言えません。 そのため論文テキストの解析を行う場合、以下のいずれかの選択をする必要があります。 オープンアクセス論文に限って全文を解析 有料ジャーナルも含めてTitle, Abstractのみを解析 そして、どちらのアプローチを取っても片手落ち感が出てしまいます。 論文を対象とした解析の話題になると、結局いつも「有料ジャーナルの全文読めないとね...」となるのが定番でした。 きっかけ 先日、文献をLLMで解析されている方とディスカッションをしま…
3ヶ月前
LangChainを使ったSPARQLクエリ生成
fuku Tech Blog
はじめに fuku株式会社にてインターンをしています、鈴木です。本業は広島大学のゲノム情報科学研究室にて大学院生をしております。研究を進める中で「文献からの情報抽出」や「LLMの活用」に興味を持ち、関連の深いfuku株式会社で働かせていただいています。 本記事では、LLMを活用することで、自然言語を入力とし、適切なSPARQL(グラフデータベースへのクエリ文)を出力できるかどうかを試した過程を公開します。 背景・課題 グラフデータベース(RDF)にデータを問い合わせる際には、SPARQLと呼ばれるRDF専用の問い合わせ言語を使い、クエリを作る必要があります。 例えば、日本版DBpedia(wi…
8ヶ月前
【学会データベース構築 第1回】LangChainとPydanticによる構造化
fuku Tech Blog
はじめに 初めまして、fuku株式会社 代表取締役の山田です。本連載は学会の講演情報を自動で収集し、データベース化する過程の試行錯誤を公開するものです。 身近なニーズがある、個人的に関心があるなどの理由で学会の講演情報を対象としていますが、本企画の真の目的は多様かつ非構造的なテキスト情報を統一的なフォーマットに整形することができるか可能性を探ることにあります。本記事に辿り着いた方の中には論文、実験ノート、社内文書などの多様なテキストを取り扱いたいと考えている方がいらっしゃるかと思います。本企画の内容が、皆様の参考になれば幸いです。 背景・課題 発端は製薬企業の方とお話をしていた時に「学会の講演…
1年前