Markdown構造解析ツール「md2map」をオープンソースとして公開
—
株式会社エルブズ(本社:東京都渋谷区渋谷2-9-8、以下 当社)は、オープンソースソフトウェア(OSS)として、MarkdownファイルをAI解析・レビュー向けの「意味的マップ(索引+分割片)」に変換するツール「md2map」を公開したことをお知らせします。
本ツールは、当社が展開する開発支援AI「IXV(イクシブ)」の開発過程で生まれた実用ツールであり、OSS公開の第八弾となります。
md2map とは
md2map は、マークダウン形式(.md)の大規模ドキュメントを解析し、セマンティックな構造マップ(索引 + 分割された文書パーツ) を生成するCLIツールです。
ドキュメントをセクション単位に分割し、構造的な索引と元ファイルへの行番号マッピングを出力することで、AIが文書全体を理解・レビューするための前処理を効率化します。
本ツールは、社内でのAIドキュメントレビューや大規模Markdownファイルの構造解析フローにおいて、MarkdownドキュメントをAIに最適化して活用する基盤として利用されています。
主な機能・特徴
- 日本語の文書処理・文字数カウントに対応
日本語の技術文書・仕様書を扱うことを想定し、文字数ベースの計測など、日本語に適した処理に対応しています。 - 見出しベースの分割
H1〜H3(およびそれ以上)の階層構造に基づき、文書をセクションごとに分割してパーツファイルを生成します。 - 索引生成
元ドキュメントの構造ツリーをINDEX.mdとして自動生成します。 - 行番号マッピング
各分割パーツと元ファイルの対応関係を機械可読ファイル(MAP.json)として出力します。 - コードブロックに対応
解析時にコードブロック内の見出しを無視し、正確にセマンティック構造を抽出します。 - Dry Run モード
実際の出力を生成せずにプランのみを確認できます。
利用シーン
- 大規模MarkdownドキュメントをAIでレビューしたい場合
- ドキュメントの構造を可視化・管理したい場合
- 部分ごとのAI評価やコメントを元ファイルにマッピングしたい場合
- Markdownドキュメントを分割してバージョン管理したい場合
特に、AIによるドキュメント解析やレビュー自動化を進めている開発・ドキュメンテーション現場での利用を想定しています。
開発の裏側:IXVから生まれたOSS
本ツールは、当社のAI開発支援プロダクト 「IXV(イクシブ)」の研究・開発過程で生まれました。
IXVは、開発ドキュメントの構造理解を効率化することを目指しており、その中でMarkdown文書をAIに最適化するニーズが高まったことが、md2map の開発につながりました。その成果の一部を切り出し、単体でも利用できるドキュメント構造解析ツールとしてOSS公開しています。
ライセンス・公開情報
- プロジェクト名:md2map
- ライセンス:MIT License
- 対応環境:Python 3.9以上
- 公開先:GitHub (🔗 https://github.com/elvezjp/md2map)
今後について
当社では今後も、AIと人が協調する開発現場を支える取り組みの中で、開発や検証の過程で生まれた実用的なツールを、必要に応じてオープンソースとして公開していく考えです。
本件に関するお問い合わせ先
株式会社エルブズ
お問い合わせ先メールアドレス:info@elvez.co.jp