VLM 金融 自然言語処理 日本語 LLaVA SFT LoRA 継続適応 ICML 2026 CATSワークショップ

日本語金融文書のための多モーダル基盤モデルの段階的継続適応 (Staged Continual Adaptation)

CATS Workshop @ ICML 2026 採択論文。8.4Bパラメータの多モーダルモデルを、未ファインチューン時のベースライン(Phase 0)から3つの学習フェーズを経て日本語金融開示文書に適応させ、各ベンチマークが異なるフェーズでピークに達することを示した。つまり最適チェックポイントはタスク依存である。本記事はCompassプロジェクトの最新版であり、FT-LLM 2026コンペティションに向けた以前のバージョンは旧版として保存されている。

Sections: はじめに アーキテクチャ 政府PDFからのデータ生成 三段階の継続適応 実験結果 外部モデルとの比較 考察 制約 まとめ 謝辞 参考文献
Read more →
VLM 金融 自然言語処理 日本語 LLaVA SFT LoRA 旧版 FT-LLM 2026

[旧版] Compass: 推論強化と文書読解の統合による日本語金融Vision-Language Modelの開発(FT-LLM 2026 版)

[旧版 / FT-LLM 2026 版] 日本語金融文書理解に特化したVision-Language Model「Compass」。本記事はCompassプロジェクトのFT-LLM 2026自由形タスク向けの初期版である。最新版(CATS Workshop @ ICML 2026採択、段階的継続適応の研究として再構成)は /mysite/ja/blog/compass/ で公開している。

Sections: はじめに アーキテクチャ 学習パイプライン データセット 実装の詳細 評価設定 実験結果 まとめと今後の展望 謝辞 参考文献
Read more →