Stockmark Tech Blog
https://stockmark-tech.hatenablog.com/
自然言語処理テクノロジーで社会を進化させる ストックマークのテックブログです。
フィード
Vue Fes Japan 2024 はとてもフェスだった!イベント参加レポート #vuefes
Stockmark Tech Blog
ストックマーク技術広報・エンジニアの安藤( @ampersand_xyz )です。 2024/10/19(土)に開催されたVue Fes Japan 2024(以下 VueFes2024)に、ストックマークはゴールドスポンサーおよびネームカードスポンサーをさせていただきました。 本時期ではVueFes2024の参加レポートをお伝えさせていただきます。 Vue Fes Japan 2024とは ”とてもフェスだった”とは クリエイティブウォールのメッセージもアツい チームリードの @tsukkee がLTに登壇! LT会場では公式からのサイリウム配布 やるしかない、推しうちわ…! スポンサーにつ…
2ヶ月前
Vue Fes Japan 2024 登壇&協賛のお知らせ #vuefes #vuejs
Stockmark Tech Blog
ストックマークで技術広報とエンジニアをしております 安藤( @ampersand_xyz )です。 本記事ではVue Fes Japan 2024への協賛のお知らせと、なぜ協賛をするのかということについてお伝えさせていただきます。 Vue Fesとは (公式サイトより一部抜粋)文字通り Fes =お祭りのように Vue.js を共に盛り上げ、共に学び、そしてなによりも共に楽しむために誕生 した技術カンファレンスです。イベント名に名を冠するVue.jsをはじめ、NuxtやPinia、UnUs、Oxcなど周辺のエコシステムなどについても広く取り扱われます。 詳しくは公式サイトのメッセージをご参照く…
3ヶ月前
chibivueを社内勉強会を開催して学んだらとても良かった。社内勉強会はいいぞ
Stockmark Tech Blog
社内勉強会はいいぞ!とても!! 熱量が高めの見出しから失礼します。ストックマークの技術広報をしている安藤( @ampersand_xyz )です。 本記事ではストックマークのエンジニアチームで実施したThe chibivue bookの勉強会について、どのように実施したか、どういった効果が得られたかをお届けします。 ubugeeei.github.io 社内勉強会はいいぞ!とても!! 社内勉強会をやるまで きっかけはフロントエンド技術のキャッチアップ 先輩たちが作ってくれていた社内勉強会の文化 勉強会の準備 実施内容・計画の作成と組織内への共有 Slackのチャンネルを作成 勉強会の実施 実施…
3ヶ月前
Vue Fes Japan × TSKaigi 合同イベント 「次世代フロントエンドツールチェイン」は広い学びのある最高のイベントだった #vuefes_tskaigi
Stockmark Tech Blog
こんにちは、ストックマークで技術広報とエンジニアをさせていただいています安藤( @ampersand_xyz )です。 本記事では2024/10/2に開催された Vue Fes Japan × TSKaigi 合同イベント 「次世代フロントエンドツールチェイン」 のイベントの参加レポート・セッションの記録をお伝えさせていただきます。 Vue FesとTSKaigiが合体した奇跡の大満足イベントでした Vue Fes Japan 2024 見どころ紹介 / Vue.js-jp 沖さん 登壇予定だったKazuponさんに変わって、Vueの日本コミュニティの沖さんがファシリテーション&登壇され、今年…
3ヶ月前
PyCon JP 2024 ブース運営・参加レポート #pyconjp2024
Stockmark Tech Blog
ストックマークの技術広報をさせて頂いてる安藤 ( @ampersand_xyz )です。 2024/9/27~28の2日間にかけて、PyCon JP 2024(以下、PyCon)に弊社のスポンサーブースを出展させていただきました。 今回、ストックマークとしても自分個人としてもPyConへの参加ははじめてでした。 カンファレンスがどのような雰囲気や来場者層なのかが事前にイメージできておらず、ドキドキしながら挑ませていただきましたが、参加させていただいた結果としては非常にスポンサーをして良かったと感じています。 本記事ではブースにて行わせていただいた内容やイベントの様子、ブーススタッフとして参加し…
3ヶ月前
第19回YANSシンポジウム参加レポート
Stockmark Tech Blog
ストックマークでResearcherをしている會田です。2024/9/4~6に開催されたYANSにて、ゴールドスポンサーとして参加いたしました。 個人としては初参加のYANSですが、若手中心の学会のため活気があり、最先端の研究に囲まれ、非常に楽しく有意義な時間を過ごせました。 Day1 : ハッカソン参加 初日はハッカソンに参加しました! テーマは「言語芸術生成」で、GPT4o-miniのAPIを使い川柳・大喜利を生成する課題です。Researcherの會田・高橋もそれぞれ違うチームで参戦し、どちらも大喜利のチームに割り当てられました。取り組んだテーマは次のような内容です。 100件の「画像で…
4ヶ月前
芝浦工大附属中高の皆さんの企業訪問レポート
Stockmark Tech Blog
ストックマークの技術広報の安藤です。 2024/8/30に芝浦工大附属中学高等学校の方々がストックマークへ探究学習の一環として企業訪問にいらしてくださいました。 生徒の方々の取り組みや、ストックマークで行わせていただいた内容について本記事ではレポートとしてお届けさせていただきます。 芝浦工大附属中学高等学校で取り組みされている「探究学習」とは? 芝浦工業芝浦工大附属中学高等学校にて2021年4月から始められた取り組みで、問題解決型学習(PBL)を取り入れたカリキュラムの実践を通して、未来を創造できる人材育成を目指すというものです。 取り組みの内容について詳しくは芝浦工大附属中学高等学校のプレス…
4ヶ月前
Developers Summit2024 ブース運営・参加レポート
Stockmark Tech Blog
ストックマークの技術広報をさせていただいてる安藤(@ampersand_xyz)です。 2024/07/23 - 24に開催された 翔泳社様が主催するDevelopers Summit 2024 Summerにブーススポンサーとして協賛を行いイベント参加をしてきました! Developers Summit(以下、デブサミ)への参加自体が初めてだったのですが、イベントへの参加を通して非常に有意義な体験をさせていただいたので、早速レポートとしてお伝えさせていただきます。 前半はブースの企画や運営と反省点、後半はデブサミのイベントの様子といち参加者としての感想を書かせていただきます。 ブース企画と展…
5ヶ月前
Ruby on Railsのバックエンドアプリケーションに静的型検査のSorbetを導入して継続的な運用をはじめた話
Stockmark Tech Blog
ストックマークでProduct Engineerとして Anews を開発しているiwashiroです。 弊社の開発エンジニアは普段、インフラ・バックエンド・フロントエンド・MLタスクの垣根なくフルスタックに開発しているのですが、今回は普段開発している AnewsのRuby on Railsで構築されているバックエンドアプリケーションに、Sorbetという静的型検査の仕組みを導入し、合わせてCIも整備して継続的な運用をはじめたことについてお話させていただきます。 TL;DR 抱えていた課題 プロダクトの成長に伴って開発体制も大きくなり、コードベースも複雑さを増す一方で、レビューや動作確認だけで…
6ヶ月前
Anews社内情報検索を実現する技術
Stockmark Tech Blog
本記事では、Anewsの「社内情報検索機能」の裏側を紹介いたします。 本機能は複数の要素技術が組み合わさって実現されており、設計・実装において考慮すべきポイントが多数ありました。 本記事では、それらの全容についてご紹介します。 本記事の構成は次のとおりです。 社内情報検索機能とは? 設計の全体像 設計・実装のポイント 今後に向けて 社内情報検索機能とは? 調査レポートや技術報告書、実験データなど、組織に眠る様々な情報を、ビジネスニュースや論文・特許などの外部情報と同時に検索できる機能です。 これまでもAnewsでは、国内外のビジネスサイトや学術雑誌、プレプリントの論文などから情報を提供していま…
6ヶ月前
Hugoから はてなブログへの移行は意外と大変だった話
Stockmark Tech Blog
ストックマークでプロダクトエンジニアとDevRelを兼務している安藤(@ampersand_xyz)です。 テックブログをはてなブログに移行しました 月末にストックマークのテックブログを自社で運用していたHugoからはてなブログへ移行しました。特に何らかの告知などは行わず極めてヌルリ…と静かに移行を行ったのですが、その作業についての記録を共有させていただきます。 移行した目的 なぜブログを移行したのかについてですが、色々と目的がありました。 運用面 記事の投稿用エディタがあるブログプラットフォームを使用することで、ブログを書きたい人の記事作成・確認のためのハードルを下げたかった Hugoの執筆…
6ヶ月前
Stockmark-100b: ビジネスドメインに対応した1000億パラメータ規模の大規模言語モデルの事前学習
Stockmark Tech Blog
ストックマークは最近、ビジネスドメインに対応した1000億パラメータ規模の大規模言語モデルであるStockmark-100bの開発を行い、事前学習モデルと指示学習モデルをオープンソース(MITライセンス)として公開しました。この記事では事前学習における弊社の取り組みを紹介させていただきます。 プレスリリース: stockmark.co.jp 事前学習モデル: huggingface.co 指示学習モデル: huggingface.co 背景 2024年2月に国立研究開発法人新エネルギー・産業技術総合開発機構(NEDO)が実施する「ポスト5G情報通信システム基盤強化研究開発事業/ポスト5G情報通…
7ヶ月前
なぜ分割代入をすると Vue は reactive ではなくなるのか
Stockmark Tech Blog
こんにちは。 Anews の開発に携わっている Engineer の 羽柴 と申します。 Anews はフロントエンドを Vue で開発しています。 自分自身の背景として、Stockmarkに入社するまでは React を使って開発していたので Vue の経験は殆どない状態でした。 そこで理解を深めるために chibivue を使った勉強会を社内で進めています。 その時に気づいたことを share したいなと思い、この記事を書きました。 ja.vuejs.org chibivueとは Vue を書き始めた感想 chibivue の勉強会を進めて Proxyについて でもなんで まとめ 余談 最…
7ヶ月前
RubyKaigi 2024 参加レポート
Stockmark Tech Blog
はじめに ストックマーク株式会社のエンジニア @nyancat3 です。 先日RubyKaigi 2024に一般参加しました。印象に残った8セッションの概要と感想を書きます。 Day 1 Writing Weird Code The grand strategy of Ruby Parser Strings! Interpolation, Optimisation & Bugs Let's use LLMs from Ruby 〜 Refine RBS types using LLM 〜 Day 2 Finding Memory Leaks in the Ruby Ecosystem Brea…
7ヶ月前
コアメンバーの連続退職、エンジニア組織崩壊の危機から、退職ゼロ・人員倍増に至るまでの話
Stockmark Tech Blog
事業背景 やったこと 学び 今後の取り組み 最後に 2023年の4月から、プロダクト開発チームのEMを務めている岩谷です。本記事では、当時プロダクトエンジニア13人中3人の退職が重なる中々しびれる状況から、エンゲージメントや開発品質の改善に向き合い、怒涛の半年間が過ぎ、現在21人の組織になるまでに取り組んできたことや学びについてご紹介できればと思います。 事業背景 2023年3月以前、以下のような組織体制で、私はML Engineering / MLOpsを推進する基盤チームのEMを勤めておりました。 プロダクト開発チームは、いわゆるマトリクス組織で、3つの職能横断のフィーチャーチームを構成し…
1年前
破壊的変更を乗り越えてVue3移行達成した話
Stockmark Tech Blog
はじめに この記事では、私たちが開発しているAnewsというプロダクトでのVue 3移行プロジェクトについて紹介していきます。 Anewsはビジネス向けにユーザーの趣向に合わせて日々のニュースなどの最新情報を提供するプロダクトです。フロントエンドはVue.jsというフレームワークを使用しています。2023年末にVue 2のサポート期限が迫っており、それまでにAnewsのVue 3移行を完遂すべく、Vue 3移行プロジェクトを行いました。 そこで得られた知見としてVue 2とVue 3の違いや、必要だった対応、実際に行った移行戦略などまとめていきたいと思います。 移行前の環境 今のAnewsは2…
1年前
1年かけてAnewsのドキュメントを改善した話
Stockmark Tech Blog
エンジニアリングユニットの酒井といいます。 昨年の9月に入社し、Anewsの開発に従事しつつ時々SREっぽいこともしています。 今回は、自分が入社当初から改善したいなぁと考えていたAnewsのドキュメントについて、これまでやってきた取り組みについてお話しできればと思います。 取り組みを始めたきっかけ そもそも自分は組織開発において、ドキュメントが重要だという認識がありました。それはこれまでの経験則によるところもありますし、『Googleのソフトウェアエンジニアリング』中で以下のような言及があり、重要性を再認識したというのもあります。 10.2 何故ドキュメンテーションが必要なのか p220: …
1年前
改善施策のプランニングが鍵 - 大規模バッチ処理のテストフレームワーク刷新プロジェクト
Stockmark Tech Blog
こんにちは、エンジニアリングユニットの飯森です。 先日、Anewsのバッチ処理のテストフレームワークを刷新するプロジェクトに取り組みました。 本記事ではこの取り組みについて紹介します。 本記事を読むことで、以下の2点が分かります。 バッチ処理のテストフレームワークの刷新をどのように進めたのか ストックマークでは工数がかかる改善施策にどのように取り組んでいるのか プロジェクトの背景 最初に、Anewsのバッチ処理とそのテストフレームワークについて説明します。 Anewsとバッチ処理 ストックマークはAI 情報収集プラットフォームAnewsを運営しています。 Anewsでは、ニュース、論文、特許と…
1年前
Instruction Tuningを行なった130億パラメータの日本語LLMの公開:Stockmark-13b-instruct
Stockmark Tech Blog
Research部門の近江崇宏です。 先日、ストックマークではビジネスのドメインや最新情報(2023年9月まで)に対応した130億パラメータの大規模言語モデル(LLM)であるStockmark-13bを公開しました(Stockmark-13bの詳細に関しては、こちらのブログを参照ください)。 今回、Stockmark-13bに対して追加の学習を行い、ユーザーの指示に従うように訓練したStockmark-13b-instructを公開します。 モデルはHuggingface Hubからダウンロードいただけます。 Stockmark-13b-instructのライセンスはCC BY-NC-SAで、…
1年前
ビジネス情報収集のAI化という未知の冒険を支えるデータ組織
Stockmark Tech Blog
ストックマークでData Intelligence UnitでUnit Leaderをしている坂本です。 今回はこのData Intelligence Unit(通称データチーム)の取り組みを紹介します。 ストックマークのサービスについて ストックマークは、「Anews」と「Astrategy」という2つのサービスを提供しています。 現在我々はAnewsをメインで担当しているため、Anewsを中心にお話しさせていただきます。Anewsはニュース、論文、特許といった様々な情報を国内外35,000メディアから集めてデータベース化し、企業ユーザーに対してAIによる最適な情報配信を提供しています。既に…
1年前
ビジネスのドメインや最新情報に対応した130億パラメータの日本語LLMの公開
Stockmark Tech Blog
Research部門の近江崇宏です。 ストックマークではビジネスのドメインや最新情報(2023年9月まで)に対応した130億パラメータの大規模言語モデル(LLM)を商用利用も可能なライセンスで公開しました。 モデルはHuggingface Hubからダウンロードいただけます。 https://huggingface.co/stockmark/stockmark-13b このモデルは、合計2200億トークンの日本語のテキストデータにより事前学習が行われました。 一般に事前学習でよく使われるWikipediaやCommonCrawl由来のコーパスだけではなく、当社が独自に収集しているビジネスに関連…
1年前
より多くの “気づき” を届ける- 世界中のテキストの構造化に挑む Knowledge Unit の紹介 -
Stockmark Tech Blog
Stockmark の Researcher の広田です。 Stockmark には自然言語処理の研究開発を行う Research チームがあり、 その中の1つの組織に知識グラフの自動構築をテーマとする Knowledge Unit があります。 この記事では Knowledge Unit の取り組みを紹介します。 なぜ知識グラフなのか? ストックマークは企業向けの情報収集ツール Anews を提供しています。 私たちはよくお客様から、まだ自分たちが気づけていない情報があるのではないか不安だ、という声を耳にします。 市場動向や技術動向・競合他社情報などから気づきを得ることはビジネスにおいて非常…
1年前
最近の話題にも詳しい14億パラメータの日本語LLMの公開
Stockmark Tech Blog
Research部門の近江崇宏です。 今回、ストックマークは最近の話題にも詳しいGPT-NeoXをベースとした14億パラメータの日本語のLLM(大規模言語モデル)をオープンソースとして公開します。モデルはHugging Face Hubからダウンロードいただけます。 https://huggingface.co/stockmark/gpt-neox-japanese-1.4b 当社はビジネスにおける情報収集・分析をサポートするサービスを運営しており、そのために最新のWebデータの収集を日々行なっております。今回の事前学習では、一般にLLMの事前学習によく使われるCommon Crawl由来のデ…
1年前
エンジニア採用候補者の方にお伝えしたいこと
Stockmark Tech Blog
組織の特徴(仕組みの面) 組織の特徴(文化面) どのような方にJoinしていただきたいか? 採用状況・窓口について こんにちは、エンジニアリングユニットの岩谷と申します。今回はエンジニア組織と、採用の観点について記載していきたいと考えています。 動機は2つあり、 - 選考プロセスを進めた上で組織・人の面を見て魅力的に感じていただけることが多く、選考前の方にもしっかり発信していきたい - 文面だけでは見えないカルチャーやマインド面での相互不一致を減らしたい 何かしらのきっかけでストックマークにご興味を持っていただいた方(まだ興味がない方も!)には、是非1度読んでいただけると幸いです。 組織の特徴…
1年前
価値検証を高速化するために開発チームで意識していること
Stockmark Tech Blog
はじめに どのスタートアップ企業でも、プロダクトリリースサイクルの高速化・最適化を心がけているかと思います。本記事では、ストックマークのプロダクトである Anews の新機能(論文配信)を例にとって、ストックマークの開発の実際について紹介いたします。 本記事から学べる点は大きく 3 点です。 高速な価値提供を実現するために意識すべきこと フロー効率の極大化によりユーザー価値へつなげる方法 中期目線で開発速度を保つ方法 それでは、それぞれ個別に 1 つ見ていきましょう。 高速な価値提供を実現するために意識すべきこと どんなプロダクトであっても、実装しようとしている機能は、何らかの方法で検証してみ…
2年前
Extractive Noise Removal from Scraped News Articles using BERT and comparison with ChatGPT
Stockmark Tech Blog
Motivation Input Description Data Annotation Annotation Statistics Model Architecture Processing Steps Boundary removal Intrinsic Evaluation Extrinsic Evaluation (Query based evaluation) Comparison with ChatGPT / GPT3 Prompt Design for News Noise Reduction The Prompt: Comparing our output Article Me…
2年前
記事中のノイズ削除方式 - ChatGPTとの比較
Stockmark Tech Blog
前提: 記事中のノイズ削除がなぜ必要なのか? どのようにストックマークでノイズ削減を実現しているか? ChatGPT Plus(GPT-4) との比較 まとめ 本記事執筆時点の2023年4月時点で、ChatGPTのニュースを見ない日はないほど、世の中にChatGPTの記事が溢れています。「こんなことに使える」「あんなことに使える」と応用範囲が広いChatGPTですが、「あたかも当然のように嘘をつく」ように決して万能なわけではなく得手不得手があります。そんなChatGPTに対して、プロダクト開発側に立つ方にとって気になるのは「実際にプロダクトに組み込めるのだろうか?」という点でしょう。 そこで、…
2年前
Multi-purpose Recomender Platform using Perceiver IO
Stockmark Tech Blog
Introduction Perceiver IO Our Approach Designing Input Features Experiments Conclusion Introduction Web services usually require many different types of recommender systems using large amount of user log and content data. It is no different for Stockmark! For example, news article, category and keyw…
2年前
AWSのコスト削減: ストレージクラスの最適化
Stockmark Tech Blog
何を実施したか? コスト分析と監視: コストが高い要素の把握 ストレージの最適化 コスト試算時の注意点 ストレージクラスの変更に伴う影響調査 実際の移行 今後に向けて まとめ クラウドインフラに関わるコストは、各企業にとって1つの重要テーマかと思います。毎月、支払うコストであり、数%の増減であったとしても最終的にかなりの金額になります。 昨今の為替事情もあり、そんなクラウドインフラのコストを弊社で削減してきた方法を本記事で紹介いたします。本記事を読むことで、実例と共に手法を学んでいただけます。 何を実施したか? ストックマークでは、クラウドインフラに AWS を活用しています。AWS のコスト…
2年前
6千万記事レコードの大規模データマイグレーション
Stockmark Tech Blog
背景 検討の進め方と移行後の方式 大変だったこと 再現可能な知見 まとめ 本記事では、ストックマークで2022年の12月に実施した、6千万件を超える記事レコードの大規模データ基盤マイグレーションについて紹介いたします。本記事を読むことで、大規模データマイグレーションの勘所を実例から学べます。 本記事でお伝えする内容は以下の4点となっています 背景 検討の進め方 大変だったこと 再現可能な知見 背景 ストックマークでは大量の記事データを利用するプロダクトとして、AnewsとAstrategyの2つのプロダクトがあります。どちらのプロダクトも共通の記事データストアにある内容に、プロダクトごとの弊社…
2年前